Новый метод обучения моделей: учёт марковского шума и тяжёлых хвостов
Разработан усовершенствованный метод SGD для обучения моделей с учётом марковского шума и тяжёлых хвостов в данных — это повышает точность и надёжность обучения.
93 статьи по теме
Разработан усовершенствованный метод SGD для обучения моделей с учётом марковского шума и тяжёлых хвостов в данных — это повышает точность и надёжность обучения.
Разработан метод анализа когнитивных задач через МРТ: от переноса данных «один к одному» к анализу связей «многие к одному» с применением BIP и 1127 моделей.
Платформа RQGM позволяет ИИ‑агентам эффективнее самосовершенствоваться за счёт динамической смены критериев оценки. Показала лучшие результаты в кодировании, написании и рецензировании статей и др.
Mesh-RL ускоряет обучение с подкреплением за счёт разбиения среды на подсети — повышает скорость сходимости и стабильность в Q-learning, SARSA, Dyna-Q.
Представлен адаптер HRM для SSM-моделей — он эффективнее LoRa в задачах с длительным контекстом, показал рост точности на 34,8–71,6% в тестах на Mistral-7B.
Фреймворк EVOM автоматически создаёт архитектуры для обучения с подкреплением «актёр-критик», превосходя ручные методы и другие подходы. Тестировался на Ant-v4 и HalfCheetah-v4.
Новая структура на базе GNN позволяет извлекать алгебраические свойства групп из их графовых представлений (графов Кэли).
Разработаны методы повышения симметрии в байесовских нейросетях за счёт расширения данных; один из методов показал преимущество перед базовым подходом.
Предложен метод оценки доли данных, использованных для обучения ИИ-модели, без сложных дополнительных моделей и скрытых данных. Протестирован на моделях генерации изображений.
Fast-LeWM ускоряет планирование действий в визуальных системах и снижает накопление ошибок по сравнению с LeWM.
Разработан метод обнаружения наводнений с помощью топологического анализа спутниковых снимков — он даёт более понятные и надёжные результаты по сравнению с прежними моделями.
Разработана платформа Clue2Group: она выявляет группы по отмыванию денег, работая от конкретной зацепки и объединяя данные о рисках и структуре финансовых операций.
Модель FHPLF объединяет обучение хэшированию и федеративное обучение, снижая затраты на вычисления и повышая защиту данных при сохранении высокой точности.
Антонио Феррара предлагает новый подход к алгоритмической справедливости — с учётом структурного контекста, а не только упрощённых оценок. Это поможет снизить предвзятость в ИИ.
Исследование показало нестабильность оценок безопасности с помощью LLM-as-judge даже при настройках для детерминированности; предложены рекомендации по улучшению воспроизводимости результатов.
Йобст Хайциг разработал способ для ИИ-«оракула», позволяющий давать объективные и самосогласованные оценки вероятностей событий, избегая искажений из‑за самореференции. Метод основан на теории решёток.
Разработана система агрегатора агентов для оптимизации работы парка электробусов — она в реальном времени корректирует тарифы и расписание с учётом разных факторов.
Система KG-TRACE объясняет, почему бактерии устойчивы к лекарствам, объединяя геномные данные и биологические знания; показала высокую точность на данных о туберкулёзе.
Разработан метод MCTS для решения экстремальных задач комбинаторной геометрии: он учитывает геометрические ограничения и использует симметрии для ускорения поиска решений, что позволило получить новые результаты по ряду задач.
Исследование выявило пробелы в оценке мультимодальных ИИ-моделей (MLLM): нынешние методы не показывают, как модели объединяют данные из разных источников (текст, фото, аудио и др.).