Deep Digest — AI на русском

ИИ автоматически превращает инструкции в проверенные политики — прорыв в безопасности агентов

Система на базе LLM автоматически превращает текстовые инструкции в формальные проверенные политики для агентов (на языке Cedar). В тестах MedAgentBench превзошла ручное кодирование.

Исследователи разработали систему, которая автоматически преобразует текстовые инструкции и описания политик в формальные, проверенные политики для агентов. Для этого используется цикл генерации и анализа на основе LLM. Полученные политики записываются на языке Cedar. В тестах на датасете MedAgentBench система показала лучшие результаты по сравнению с ручным кодированием: она охватывает больше требований из исходных текстовых описаний. Это позволит повысить надёжность и безопасность агентов в критически важных сферах.