50 миллионов рублей на цифровые миры: как Patronus AI тестирует агентов искусственного интеллекта

Агенты с искусственным интеллектом становятся всё более совершенными: они переходят от ответов на вопросы к автономному выполнению сложных многоэтапных задач. Однако прежде чем доверить им бронирование поездок или финансовый анализ, разработчики хотят убедиться в их надёжности в самых разных сценариях. Стартап Patronus AI, основанный в 2023 году бывшими исследователями Meta AI Анандом Каннаппаном и Ребеккой Цянь, помогает настраивать модели — он создаёт имитационные цифровые среды, где можно оценивать работу агентов. В таких средах после обучения агенты проходят стресс‑тестирование с использованием обучения с подкреплением: за успешное выполнение задания их «вознаграждают», а за ошибки — «наказывают». За последний год выручка Patronus выросла в 15 раз, что привлекло внимание инвесторов. В четверг компания объявила о раунде серии B стоимостью 50 миллионов долларов под руководством Greenfield Partners при участии Notable Capital, Lightspeed, Datadog и Samsung. После этого раунда общий объём финансирования компании достигнет 70 миллионов долларов. Patronus создаёт копии веб‑сайтов и внутренних систем — в этих средах агенты могут опробовать различные, порой непредсказуемые сценарии. Компания сравнивает свой подход с тем, как Waymo обучала автономные автомобили: сначала создавала искусственные миры для тестирования транспортных средств в условиях редких опасностей (например, суровой погоды или ситуации, когда ребёнок бежит за мячом). Сейчас Patronus предоставляет свои имитационные цифровые миры для разработки ПО и в финансовой сфере, но, по словам Каннаппана, это только начало. Стартап считает своими основными конкурентами внутренние команды лабораторий ИИ, которые уже созданы для оценки поведения агентов. При этом Patronus оценивает поведение агентов без участия человека — в отличие от компаний, работающих с человеческими данными.