DeepDigest
← все статьи
Agents

Agents

10 статьи по теме

arXiv cs.LG

«Красная королева» ускоряет самосовершенствование ИИ-агентов

Платформа RQGM позволяет ИИ‑агентам эффективнее самосовершенствоваться за счёт динамической смены критериев оценки. Показала лучшие результаты в кодировании, написании и рецензировании статей и др.

читать → 1 просмотр
arXiv cs.LG

EVOM: ИИ-агент самостоятельно создаёт эффективные архитектуры для обучения с подкреплением

Фреймворк EVOM автоматически создаёт архитектуры для обучения с подкреплением «актёр-критик», превосходя ручные методы и другие подходы. Тестировался на Ant-v4 и HalfCheetah-v4.

читать → 1 просмотр
arXiv cs.AI

Агенты оптимизируют работу парка электробусов: новый подход к координации

Разработана система агрегатора агентов для оптимизации работы парка электробусов — она в реальном времени корректирует тарифы и расписание с учётом разных факторов.

читать → 1 просмотр
arXiv cs.AI

Скрытое влияние: как редактирование одного модуля меняет работу всей агентной системы

Обнаружена проблема в агентных системах: изменение одного модуля может незаметно влиять на другие (CBL). Протестировано на Claude Sonnet 4.6, предложен протокол для выявления сбоев.

читать → 1 просмотр
arXiv cs.AI

Проверка решений в кодировании: почему «серебряной пули» не существует

Авторы исследовали проблемы проверки решений в кодировании при развитии ИИ и предложили 4 схемы вознаграждения для верификации задач. Эксперименты подтвердили эффективность подхода.

читать → 1 просмотр
arXiv cs.AI

LLM-конвейер раскрывает секреты управления в агентных системах

Разработан конвейер на базе LLM для анализа управления в агентных системах ИИ. Протестирован на ERC-8004 и Google A2A: выявлены общие черты неравенства и фрагментации, а также тенденция к тематической конвергенции при открытом управлении.

читать → 1 просмотр
Google AI Blog

Google I/O 2026: главные новинки — от Gemini до интеллектуальных очков

На Google I/O 2026 компания представила новые модели ИИ (Gemini Omni, Gemini 3.5 Flash), информационных агентов в поиске, обновлённый интерфейс Gemini (Neural Expressive), персонального ИИ‑агента Gemini Spark и другие разработки. Среди новинок — ежедневная сводка в приложении Gemini, универсальная корзина покупок и интеллектуальные очки для Android XR.

читать → 1 просмотр
Google AI Blog

Gemini Omni и Gemini 3.5: 9 демонстраций возможностей

На Google I/O 2026 представили модели Gemini Omni и семейство Gemini 3.5. Gemini Omni позволяет создавать и редактировать видео, комбинируя разные типы данных. Версия 3.5 Flash отличается высокой производительностью и подходит для сложных задач — её интегрировали в приложение Gemini и поиск. Также появился персональный агент Gemini Spark.

читать → 1 просмотр
arXiv cs.AI

Новый взгляд на оценку ИИ: что скрывается за максимальной точностью?

Авторы предложили оценивать ИИ-агентов не только по точности, но и по другим параметрам (надёжность, эффективность и др.), представив обновлённый тест CORE-Bench и выявив ускорение решения задач при взаимодействии человека и агента.

читать → 2 просмотра