DeepDigest
arXiv cs.AI · · ~1 мин

ИИ-конвейер автоматически превращает инструкции в безопасные политики

Конвейер на базе LLM автоматически превращает текстовые инструкции в формально проверенные политики на языке Cedar; в тесте MedAgentBench показал лучшее покрытие требований, чем ручные решения.

cs.AI
arXiv
Cornell University Library

Авторы разработали конвейер, который автоматически преобразует текстовые инструкции для агентов, описания инструментов MCP и документы о политике на естественном языке в формально проверенные политики. Политики пишутся на языке Cedar. В основе процесса — цикл генерации и анализа с использованием больших языковых моделей (LLM). В тесте MedAgentBench автоматически созданные политики лучше охватывают исходные требования, чем вручную закодированные решения из предыдущих работ. Это важный шаг к повышению безопасности агентов в критически важных областях.

Источник: arXiv cs.AI
1 просмотров
// поделиться Telegram VK