DeepDigest
← все статьи
Research

Research

93 статьи по теме

arXiv cs.AI

Скрытое влияние: как редактирование одного модуля меняет работу всей агентной системы

Обнаружена проблема в агентных системах: изменение одного модуля может незаметно влиять на другие (CBL). Протестировано на Claude Sonnet 4.6, предложен протокол для выявления сбоев.

читать → 1 просмотр
arXiv cs.AI

Новый подход к этическим рассуждениям в ИИ: система «изложение мыслей»

Разработана система NoT для структурирования этических рассуждений в ИИ: она снижает число упущенных факторов в моральных дилеммах и помогает достигать консенсуса в дебатах.

читать → 1 просмотр
arXiv cs.AI

QES: новый подход к научным открытиям в эпоху ускоряющегося прогресса

Статья предлагает Qualitative Engine for Science (QES) как способ преодолеть ограничения ускорения технологического прогресса в научных открытиях и сократить разрыв между ИИ и человеческим мышлением.

читать → 1 просмотр
arXiv cs.AI

Агенты LLM прошли испытание на задачах энергетической аналитики

Агенты на базе LLM протестированы на 243 задачах энергетической аналитики — от анализа данных до сложного моделирования; сравнивались модели с закрытым и открытым кодом.

читать → 1 просмотр
arXiv cs.AI

Проверка решений в кодировании: почему «серебряной пули» не существует

Авторы исследовали проблемы проверки решений в кодировании при развитии ИИ и предложили 4 схемы вознаграждения для верификации задач. Эксперименты подтвердили эффективность подхода.

читать → 1 просмотр

Apple представила третье поколение моделей Apple Foundation Models

Apple представила третье поколение моделей Apple Foundation Models — семейство из пяти моделей для устройств и облачных вычислений. В него входят встроенные и серверные модели с мультимодальными возможностями. Архитектура моделей позволяет преодолевать ограничения по объёму памяти и обеспечивать конфиденциальность данных.

читать → 1 просмотр
arXiv cs.AI

COrigami: ИИ поможет создать узнаваемое оригами

Система COrigami на базе ИИ создаёт шаблоны оригами по текстовому описанию, объединяя алгоритмическую оптимизацию и эстетическую оценку — помощник для художников в проектировании сложных форм.

читать → 1 просмотр
arXiv cs.AI

Новый подход к управлению ИИ: как контролировать автономные системы без слежки за их рассуждениями

Предложена модель управления ИИ-агентами: агенты автономны в рассуждениях, но рискованные действия требуют подтверждений от независимых источников и фиксируются в защищённом журнале.

читать → 1 просмотр
arXiv cs.AI

LLM-конвейер раскрывает секреты управления в агентных системах

Разработан конвейер на базе LLM для анализа управления в агентных системах ИИ. Протестирован на ERC-8004 и Google A2A: выявлены общие черты неравенства и фрагментации, а также тенденция к тематической конвергенции при открытом управлении.

читать → 1 просмотр
arXiv cs.AI

ИИ-платформа раскрывает данные о побочных эффектах антидепрессантов

Создана ИИ-платформа, объединяющая официальные отчёты и данные от пациентов о лекарствах для психического здоровья; выявлены более ранние сигналы о побочных эффектах в сообществах.

читать → 1 просмотр
Google AI Blog

Прототипы ИИ от Google: обучение с помощью технологий

В Лаборатории будущего под руководством Google и Университета Ватерлоо студенты разрабатывают ИИ-прототипы для образования. Среди проектов — приложение для изучения японского языка, инструмент для освоения языка жестов и система для тренировок по художественной гимнастике. Инициатива помогает учащимся создавать технологии будущего.

читать → 1 просмотр
Google AI Blog

Обновления Google в области ИИ: Gemini 3.5, Gemini Omni и новые инструменты (май 2026)

В мае 2026 года Google представил новые модели ИИ — Gemini 3.5 и Gemini Omni, а также ряд инструментов и оборудования для интеграции искусственного интеллекта в повседневную жизнь. Среди новинок — приложение Google Health, универсальная корзина для покупок, приложение Android Halo и экспериментальные решения для моделирования сред. Компания также развивает научные и экологические инициативы с использованием ИИ.

читать → 1 просмотр
Google DeepMind

Google: дорожная карта управления ИИ для безопасности агентов

Google представила дорожную карту управления ИИ, чтобы обеспечить безопасность агентов по мере роста их возможностей. Подход включает систему моделирования угроз на основе MITRE ATT&CK, средства контроля ИИ и измерение ключевых показателей производительности. Компания также опубликовала техническое руководство для разработчиков политики «Три уровня безопасности агентов».

читать → 1 просмотр
arXiv cs.CL

LLM сталкиваются с трудностями при решении инженерных задач с диаграммами

Исследование показало: LLM хорошо решают текстовые инженерные задачи, но ошибаются при работе с диаграммами и многоэтапным анализом из‑за сложностей в рассуждениях.

читать → 1 просмотр
arXiv cs.CL

Обучение на полезность может лишить ИИ сострадания: новое исследование

Обучение языковых моделей на полезность может снижать уровень сострадания и моральных рассуждений, тогда как обучение кодированию лучше сохраняет ценности. Исследование проведено на Llama 3.1 8B с критериями AHB и MORU.

читать → 1 просмотр