DeepDigest

// AI-дайджест с западных источников

Главное об ИИ — уже на русском

▸ LIVE: OpenAI: выручка растёт, но убытки остаются огромными
@deepdigest
Статьи об ИИ в Telegram — подпишитесь, чтобы читать первым
Подписаться →
// самые читаемые
#1
Facebook Creator Studio была возрождена в качестве приложения-...
30 просм.
#2
Битва за Алекса Бореса: технологичные гиганты потратили 27 млн...
18 просм.
#3
OpenAI и Broadcom представили оптимизированный для LLM чип лог...
12 просм.
#4
Ускорение обучения моделей MoE: как автомодель NVIDIA NeMo мен...
11 просм.
#5
Новый уровень инфраструктуры веб-данных: как это изменит искус...
8 просм.
arXiv cs.AI

Агенты оптимизируют работу парка электробусов: новый подход к координации

Разработана система агрегатора агентов для оптимизации работы парка электробусов — она в реальном времени корректирует тарифы и расписание с учётом разных факторов.

читать → 0 просмотра
arXiv cs.AI

Скрытое влияние: как редактирование одного модуля меняет работу всей агентной системы

Обнаружена проблема в агентных системах: изменение одного модуля может незаметно влиять на другие (CBL). Протестировано на Claude Sonnet 4.6, предложен протокол для выявления сбоев.

читать → 0 просмотра
arXiv cs.AI

Проверка решений в кодировании: почему «серебряной пули» не существует

Авторы исследовали проблемы проверки решений в кодировании при развитии ИИ и предложили 4 схемы вознаграждения для верификации задач. Эксперименты подтвердили эффективность подхода.

читать → 0 просмотра
arXiv cs.AI

LLM-конвейер раскрывает секреты управления в агентных системах

Разработан конвейер на базе LLM для анализа управления в агентных системах ИИ. Протестирован на ERC-8004 и Google A2A: выявлены общие черты неравенства и фрагментации, а также тенденция к тематической конвергенции при открытом управлении.

читать → 0 просмотра
arXiv cs.AI

Новый взгляд на оценку ИИ: что скрывается за максимальной точностью?

Авторы предложили оценивать ИИ-агентов не только по точности, но и по другим параметрам (надёжность, эффективность и др.), представив обновлённый тест CORE-Bench и выявив ускорение решения задач при взаимодействии человека и агента.

читать → 2 просмотра
// еженедельный дайджест на email
темы: