Большие языковые модели: в чём их ключевое преимущество?

Разработана платформа AdvCluster для анализа преимуществ крупных языковых моделей; доказано, что они эффективнее работают с ограничениями в логических задачах.

Исследователи выяснили, почему крупные языковые модели лучше справляются с логическими задачами, чем их меньшие версии. Для анализа они создали платформу AdvCluster: она выявляет вопросы, где большая модель показывает преимущество, изучает цепочки рассуждений обеих моделей и систематизирует данные. Оказалось, что крупные модели (например, Qwen3-32B и GPT-OSS-120B) эффективнее работают с ограничениями — они лучше находят явные и неявные ограничения, структурируют рассуждения и отсеивают нерабочие варианты решения. В тестах по математике, физике, химии и программированию Qwen3-32B опережает Qwen3-8B на 6,43%, а GPT-OSS-120B — GPT-OSS-20B на 7,38%.