Новый метод улучшает работу больших языковых моделей: замкнутый цикл обработки данных

Разработан замкнутый цикл обработки данных для выявления и устранения слабых мест в LLM; метод протестирован на задачах BBH и AIME2025/AIME2026, показал эффективность.

Исследователи Чжисюань Ли, Цзянган Юань и Хань Сюй разработали новый подход для улучшения работы больших языковых моделей (LLM). Их метод основан на замкнутом цикле обработки данных и оценки: он позволяет точно выявлять слабые места модели и целенаправленно вносить правки в данные. В основе подхода — «срез возможностей»: группы оценочных выборок, которые помогают локализовать конкретные проблемы. Авторы протестировали метод на двух задачах: в одном случае удалось восстановить показатели BBH после их снижения, в другом — повысить пропускную способность AIME2025/AIME2026. Новый подход даёт возможность не полагаться на интуицию при доработке моделей, а действовать на основе проверяемых данных.