На ICML 2026 (6–11 июля, Сеул) Together AI представит восемь статей, посвящённых различным аспектам исследований в сфере искусственного интеллекта. Работа строится на интеграции всех уровней — от агентов до ядер графических процессоров. Среди разработок:
DSGym — структура для оценки и обучения специалистов в области науки о данных. Включает более 1000 задач в более чем 10 областях, объединённых единым API. Добавляет 90 экспертных заданий по биоинформатике и 92 конкурса по моделированию в стиле Kaggle. Авторы: Фань Не, Чжунлинь Ван, Харпер Хуа и другие. Документ: arXiv: 2601.16344.
ThunderAgent — агентная система логического вывода, которая обеспечивает в 1,5–3,6 раза более высокую производительность обработки для рабочих нагрузок агента. Ускоряет развёртывание RL в 1,8–3,9 раза и экономит дисковые ресурсы до 4,2 раза по сравнению с современными системами. Авторы: Хао Кан, Цзыян Ли, Синью Ян и другие. Документ: arXiv: 2602.13692.
TTT-Discover — модель, превосходящая лучшую модель humanopen (стоимостью около 500 долларов). Достигает успехов в математике, ядрах графических процессоров, конкурентных алгоритмах и биологии с помощью открытой модели 120B. Авторы: Мерт Юксекгонул, Даниэль Кочеха, Синьхао Ли и другие. Документ: arXiv: 2601.16175.
RARO (Relativistic Adversarial Reasoning Optimization) — метод обучения рассуждению без верификатора. Позволяет достигать 25% выигрыша в ответах по сравнению с 5,9% при точной настройке под наблюдением. Авторы: Локк Кай, Макс Рябинин, Иван Провилков. Документ: arXiv: 2511.21667.
V1 — подход, объединяющий генерацию и самопроверку для параллельных вычислений. Увеличивает на 10% количество правильных ответов, полученных из поколений, за которые уже заплачено. Авторы: Харман Сингх, Сююй Ли, Куша Сарин и другие. Документ: arXiv: 2603.04304.
Aurora — унифицированная система обслуживания обучения. Работает в 1,25 раза быстрее при смене трафика и в 1,5 раза за день-0 благодаря новым моделям frontier (например, MiniMax M2.1 229B и Qwen3-Coder-Next 80B). Авторы: Чжунсюн Ван, Фэнсян Би, Цзисен Ли и другие. Документ: arXiv: 2602.06932.
Ulysses — система контекстного параллелизма с экономией памяти за счёт последовательного разбиения на 5 миллионов токенов на одном узле. Позволяет сократить объём оперативной памяти на 87,5%. Авторы: Рави Гадиа, Максим Абрахам, Сергей Воробьёв, Макс Рябинин. Документ: arXiv: 2602.21196.
OEA (оппортунистическая активация эксперта) — метод экспертной маршрутизации с поддержкой пакетной обработки для ускорения декодирования без переподготовки. Ускоряет декодирование MoE до 39%, снижает задержку без изменений в архитектуре. Авторы: Костин-Андрей Онческу, Циньян Ву, Вай Тонг Чунг и другие. Документ: arXiv: 2511.02237.
Разработки будут представлены на стенде B714. Посетители смогут обсудить статьи с авторами, ознакомиться с реализацией исследований на платформе Together и узнать о планах на следующий год.