Исследователи предложили новый способ улучшить способность агентов на базе Large language model (LLM) планировать действия и предсказывать результаты. Проблема в том, что сейчас такие агенты плохо справляются с долгосрочными задачами — в отличие от людей, они не могут «прокрутить» в уме разные варианты развития событий. Авторы разработали трёхэтапную систему обучения: сначала внедряют в агента прогностические возможности, затем структурируют их, а потом дорабатывают с помощью специального обучения с подкреплением. В тестах на задачах поиска и математического анализа метод показал лучшие результаты по сравнению с существующими подходами.
arXiv cs.AI
·
·
~1 мин
Новый подход к прогнозированию: агенты LLM научатся предвидеть последствия решений
Разработан трёхэтапный метод обучения агентов LLM для более точного прогнозирования последствий действий — он эффективнее базовых подходов в задачах поиска и математического анализа.
// оригинал
arXiv cs.AI
↗ Читать оригинал
1 просмотров
// похожие статьи