Новый подход к прогнозированию: агенты LLM научатся предвидеть последствия решений

Разработан трёхэтапный метод обучения агентов LLM для более точного прогнозирования последствий действий — он эффективнее базовых подходов в задачах поиска и математического анализа.

Исследователи предложили новый способ улучшить способность агентов на базе Large language model (LLM) планировать действия и предсказывать результаты. Проблема в том, что сейчас такие агенты плохо справляются с долгосрочными задачами — в отличие от людей, они не могут «прокрутить» в уме разные варианты развития событий. Авторы разработали трёхэтапную систему обучения: сначала внедряют в агента прогностические возможности, затем структурируют их, а потом дорабатывают с помощью специального обучения с подкреплением. В тестах на задачах поиска и математического анализа метод показал лучшие результаты по сравнению с существующими подходами.