Новый метод обучения моделей: учёт марковского шума и тяжёлых хвостов
Разработан усовершенствованный метод SGD для обучения моделей с учётом марковского шума и тяжёлых хвостов в данных — это повышает точность и надёжность обучения.
4 статьи на русском
Разработан усовершенствованный метод SGD для обучения моделей с учётом марковского шума и тяжёлых хвостов в данных — это повышает точность и надёжность обучения.
Платформа RQGM позволяет ИИ‑агентам эффективнее самосовершенствоваться за счёт динамической смены критериев оценки. Показала лучшие результаты в кодировании, написании и рецензировании статей и др.
Mesh-RL ускоряет обучение с подкреплением за счёт разбиения среды на подсети — повышает скорость сходимости и стабильность в Q-learning, SARSA, Dyna-Q.
Представлен адаптер HRM для SSM-моделей — он эффективнее LoRa в задачах с длительным контекстом, показал рост точности на 34,8–71,6% в тестах на Mistral-7B.
Фреймворк EVOM автоматически создаёт архитектуры для обучения с подкреплением «актёр-критик», превосходя ручные методы и другие подходы. Тестировался на Ant-v4 и HalfCheetah-v4.
Новая структура на базе GNN позволяет извлекать алгебраические свойства групп из их графовых представлений (графов Кэли).
Разработаны методы повышения симметрии в байесовских нейросетях за счёт расширения данных; один из методов показал преимущество перед базовым подходом.
Предложен метод оценки доли данных, использованных для обучения ИИ-модели, без сложных дополнительных моделей и скрытых данных. Протестирован на моделях генерации изображений.
Fast-LeWM ускоряет планирование действий в визуальных системах и снижает накопление ошибок по сравнению с LeWM.
Разработан метод обнаружения наводнений с помощью топологического анализа спутниковых снимков — он даёт более понятные и надёжные результаты по сравнению с прежними моделями.
Разработана платформа Clue2Group: она выявляет группы по отмыванию денег, работая от конкретной зацепки и объединяя данные о рисках и структуре финансовых операций.
Модель FHPLF объединяет обучение хэшированию и федеративное обучение, снижая затраты на вычисления и повышая защиту данных при сохранении высокой точности.
Антонио Феррара предлагает новый подход к алгоритмической справедливости — с учётом структурного контекста, а не только упрощённых оценок. Это поможет снизить предвзятость в ИИ.
Исследование показало нестабильность оценок безопасности с помощью LLM-as-judge даже при настройках для детерминированности; предложены рекомендации по улучшению воспроизводимости результатов.
Система KG-TRACE объясняет, почему бактерии устойчивы к лекарствам, объединяя геномные данные и биологические знания; показала высокую точность на данных о туберкулёзе.
Chisao — оптимизатор на GPU для решения сложных задач оптимизации, работает параллельно и ускоряет вычисления в 34–39 раз. Доступен как открытый пакет Python.
Анализ методов NAS для GAN: сравнение подходов, выявление преимуществ и ограничений, указание на важность новых показателей оценки и наборов данных.
Разработана модель, объясняющая фототаксис водорослей через обучение с подкреплением и биохимические реакции; она воспроизводит эмпирические данные о движении клеток.
Создана нейросеть для быстрого и точного прогнозирования эволюции физических систем, учитывающая законы физики; эффективна для разных типов смесей.