DeepDigest
arXiv cs.AI · · ~1 мин

ИИ автоматически превращает инструкции в проверенные политики — прорыв в безопасности агентов

Система на базе LLM автоматически превращает текстовые инструкции в формальные проверенные политики для агентов (на языке Cedar). В тестах MedAgentBench превзошла ручное кодирование.

cs.AI
arXiv
Cornell University Library

Исследователи разработали систему, которая автоматически преобразует текстовые инструкции и описания политик в формальные, проверенные политики для агентов. Для этого используется цикл генерации и анализа на основе LLM. Полученные политики записываются на языке Cedar. В тестах на датасете MedAgentBench система показала лучшие результаты по сравнению с ручным кодированием: она охватывает больше требований из исходных текстовых описаний. Это позволит повысить надёжность и безопасность агентов в критически важных сферах.

// оригинал
arXiv cs.AI ↗ Читать оригинал
39 просмотров
// поделиться Telegram VK