Авторы разработали конвейер, который автоматически преобразует текстовые инструкции для агентов, описания инструментов MCP и документы о политике на естественном языке в формально проверенные политики. Политики пишутся на языке Cedar. В основе процесса — цикл генерации и анализа с использованием больших языковых моделей (LLM). В тесте MedAgentBench автоматически созданные политики лучше охватывают исходные требования, чем вручную закодированные решения из предыдущих работ. Это важный шаг к повышению безопасности агентов в критически важных областях.
arXiv cs.AI
·
·
~1 мин
ИИ-конвейер автоматически превращает инструкции в безопасные политики
Конвейер на базе LLM автоматически превращает текстовые инструкции в формально проверенные политики на языке Cedar; в тесте MedAgentBench показал лучшее покрытие требований, чем ручные решения.
1 просмотров
// похожие статьи