ICML 2026 в Сеуле: новые тренды в машинном обучении

С 6 по 11 июля в конгрессно-выставочном центре COEX в Сеуле (Южная Корея) пройдёт 43-я Международная конференция по машинному обучению (ICML 2026). Тема конференции — «Машинное обучение для реального мира».

По данным статистики конференции CS Conf, в этом году было принято 6352 статьи — это на 102 % больше, чем в прошлом. Показатель приёма составил 26,6 % (в прошлом году — 26,9 %). На Spotlight пришлось 2,2 %, на устные выступления — 0,7 % от общего числа заявок.

В этом году в конференции появились две важные корректировки: участие в выставке стало необязательным — авторы статей могут выбрать только публикацию в сборнике; оригинальная версия представленных материалов будет опубликована вместе с мнениями анонимных рецензентов, опровержениями авторов и содержанием обсуждений.

Среди ключевых трендов — рассуждения о LLM: исследователи всё больше сосредотачиваются не на увеличении параметров моделей, а на «размышлениях» — например, изучают, можно ли за счёт дополнительных вычислительных ресурсов выйти за рамки простого наращивания параметров. В некоторых работах внедряют MCTS (поиск по дереву Монте-Карло) в рассуждения LLM, другие анализируют границу между имплицитными и эксплицитными цепочками мышления.

Интенсивное обучение (RL) стало главным направлением в ICML в этом году — опубликовано 886 статей, из них 201 относится к серии PPO. Исследователи разбирают эффективность технологии GRPO, которая лежит в основе DeepSeek-R1.

Безопасность ИИ — третье по популярности направление: опубликовано 114 статей. Исследователи изучают границы уязвимости LLM, переходят от эмпирических подходов к теоретическим. Обсуждают, не навредит ли повышение «согласованности» модели с предпочтениями человека её способности к рассуждению и калибровке достоверности.

Ещё одно направление — сжатие моделей и ускорение их распространения: параллельно сжимают 116 моделей. Популярная тема — оптимизация кэш‑памяти KV: учёные ищут способы решить проблему узкого места в памяти ядра в рассуждениях LLM. Внедряются инновации в архитектуру MoE — например, плотное преобразование в MoE и стратегии ортогонального роста.

Есть прогресс в ускорении диффузии LLM: опубликовано 446 статей. Используются адаптивное кэширование, параллельное декодирование, расщепление луча с учётом энтропии — эти методы сокращают разрыв в эффективности между диффузионным и авторегрессионным LLM.

Около 860 работ (13,5 % от общего числа) посвящено ИИ для науки — от базовой модели последовательности генома dnaHNet до APE‑Bench, которая автоматически доказывается с помощью формальной математики. Около 420 статей посвящено личному интеллекту — например, метод VLAW от команды из Стэнфорда позволяет итеративно совершенствовать стратегию «визуальный язык‑действие», повышая производительность на 39,2 % в реальных задачах.

Китайские исследователи всё чаще становятся цитируемыми, а не просто следуют за трендами. Например, работа DeepSeek‑R1 заставила сообщество по‑новому взглянуть на технологию «низкая стоимость и высокая производительность». В мультимодальном направлении китайские учебные заведения формируют полную цепочку вклада — от архитектуры и обучения до оценки моделей на визуальном языке (например, Qwen‑VL (Ali), InternVL (OpenCVLab/Fudan) и DeepSeek‑VL).

Конференция ICML 2026 отражает переломный момент в исследованиях ИИ: наблюдается смена парадигмы с «ориентированной на предтренинг» на «ориентированную на посттренинг».