Исследователи разработали систему, которая автоматически преобразует текстовые инструкции и описания политик в формальные, проверенные политики для агентов. Для этого используется цикл генерации и анализа на основе LLM. Полученные политики записываются на языке Cedar. В тестах на датасете MedAgentBench система показала лучшие результаты по сравнению с ручным кодированием: она охватывает больше требований из исходных текстовых описаний. Это позволит повысить надёжность и безопасность агентов в критически важных сферах.
arXiv cs.AI
·
·
~1 мин
ИИ автоматически превращает инструкции в проверенные политики — прорыв в безопасности агентов
Система на базе LLM автоматически превращает текстовые инструкции в формальные проверенные политики для агентов (на языке Cedar). В тестах MedAgentBench превзошла ручное кодирование.
// оригинал
arXiv cs.AI
↗ Читать оригинал
39 просмотров
// похожие статьи