Исследователи разработали систему DynaSteer для улучшения рассуждений моделей большого языка (LLM). Проблема существующих подходов в том, что они побуждают модели больше думать, но не всегда приводят к правильному ответу. DynaSteer использует кластеризацию шаблонов и метод Fisher-LDA, чтобы определить «чистую истину». Система динамически отслеживает энтропию и выборочно корректирует траектории рассуждений — только когда это действительно нужно. Эксперименты на математических тестах и задачах кодирования показали, что DynaSteer эффективен и способен обобщать знания.
arXiv cs.AI
·
·
~1 мин
DynaSteer: система, которая ведёт LLM к истине
Создана система DynaSteer, которая улучшает рассуждения LLM: она динамически корректирует траектории рассуждений, используя кластеризацию и Fisher-LDA.
// оригинал
arXiv cs.AI
↗ Читать оригинал
7 просмотров
// похожие статьи