Deep Digest — AI на русском

LLM

87 статьи по теме

arXiv cs.LG 26 Jun 2026

Новый взгляд на справедливость алгоритмов: преодоление предвзятости в ИИ

Антонио Феррара предлагает новый подход к алгоритмической справедливости — с учётом структурного контекста, а не только упрощённых оценок. Это поможет снизить предвзятость в ИИ.

Research LLM Safety

читать → 1 просмотр

arXiv cs.LG 26 Jun 2026

Непредсказуемость оценок безопасности: почему LLM могут ошибаться

Исследование показало нестабильность оценок безопасности с помощью LLM-as-judge даже при настройках для детерминированности; предложены рекомендации по улучшению воспроизводимости результатов.

LLM Safety Research

читать → 1 просмотр

arXiv cs.AI 26 Jun 2026

Новый подход к прогнозированию: как избежать искажений в оценках вероятностей

Йобст Хайциг разработал способ для ИИ-«оракула», позволяющий давать объективные и самосогласованные оценки вероятностей событий, избегая искажений из‑за самореференции. Метод основан на теории решёток.

Research LLM

читать → 1 просмотр

arXiv cs.LG 26 Jun 2026

KG-TRACE: ИИ помогает разобраться в устойчивости бактерий к лекарствам

Система KG-TRACE объясняет, почему бактерии устойчивы к лекарствам, объединяя геномные данные и биологические знания; показала высокую точность на данных о туберкулёзе.

Research LLM Safety

читать → 1 просмотр

arXiv cs.AI 26 Jun 2026

Новый метод поиска решений в комбинаторной геометрии: MCTS с учётом геометрии

Разработан метод MCTS для решения экстремальных задач комбинаторной геометрии: он учитывает геометрические ограничения и использует симметрии для ускорения поиска решений, что позволило получить новые результаты по ряду задач.

Research LLM Vision

читать → 1 просмотр

arXiv cs.AI 26 Jun 2026

Пробелы в оценке мультимодальных ИИ: что мешает оценить реальные возможности моделей?

Исследование выявило пробелы в оценке мультимодальных ИИ-моделей (MLLM): нынешние методы не показывают, как модели объединяют данные из разных источников (текст, фото, аудио и др.).

LLM Multimodal Research

читать → 1 просмотр

arXiv cs.AI 26 Jun 2026

Скрытое влияние: как редактирование одного модуля меняет работу всей агентной системы

Обнаружена проблема в агентных системах: изменение одного модуля может незаметно влиять на другие (CBL). Протестировано на Claude Sonnet 4.6, предложен протокол для выявления сбоев.

LLM Research Agents

читать → 1 просмотр

arXiv cs.AI 26 Jun 2026

Новый подход к этическим рассуждениям в ИИ: система «изложение мыслей»

Разработана система NoT для структурирования этических рассуждений в ИИ: она снижает число упущенных факторов в моральных дилеммах и помогает достигать консенсуса в дебатах.

LLM Research Safety

читать → 1 просмотр

arXiv cs.AI 26 Jun 2026

OpenFinGym: новая среда для тестирования финансовых ИИ‑агентов

OpenFinGym — среда для комплексной оценки финансовых ИИ‑агентов, охватывающая прогнозирование, торговлю и выявление мошенничества.

LLM Research Business

читать → 1 просмотр

arXiv cs.AI 26 Jun 2026

QES: новый подход к научным открытиям в эпоху ускоряющегося прогресса

Статья предлагает Qualitative Engine for Science (QES) как способ преодолеть ограничения ускорения технологического прогресса в научных открытиях и сократить разрыв между ИИ и человеческим мышлением.

LLM Research Safety

читать → 1 просмотр

arXiv cs.AI 26 Jun 2026

Агенты LLM прошли испытание на задачах энергетической аналитики

Агенты на базе LLM протестированы на 243 задачах энергетической аналитики — от анализа данных до сложного моделирования; сравнивались модели с закрытым и открытым кодом.

LLM Research Business

читать → 1 просмотр

arXiv cs.AI 26 Jun 2026

Проверка решений в кодировании: почему «серебряной пули» не существует

Авторы исследовали проблемы проверки решений в кодировании при развитии ИИ и предложили 4 схемы вознаграждения для верификации задач. Эксперименты подтвердили эффективность подхода.

LLM Research Agents

читать → 1 просмотр

Apple Machine Learning 26 Jun 2026

Apple представила третье поколение моделей Apple Foundation Models

Apple представила третье поколение моделей Apple Foundation Models — семейство из пяти моделей для устройств и облачных вычислений. В него входят встроенные и серверные модели с мультимодальными возможностями. Архитектура моделей позволяет преодолевать ограничения по объёму памяти и обеспечивать конфиденциальность данных.

LLM Multimodal Research

читать → 1 просмотр

arXiv cs.AI 26 Jun 2026

COrigami: ИИ поможет создать узнаваемое оригами

Система COrigami на базе ИИ создаёт шаблоны оригами по текстовому описанию, объединяя алгоритмическую оптимизацию и эстетическую оценку — помощник для художников в проектировании сложных форм.

LLM Research Multimodal

читать → 1 просмотр

Mistral AI Blog 26 Jun 2026

Mistral OCR 4: новая модель для распознавания текста

Mistral AI представила модель Mistral OCR 4 для распознавания текста. Она извлекает текст, добавляет ограничивающие рамки, классифицирует блоки и выдаёт показатели достоверности. Модель поддерживает 170 языков, может развёртываться автономно и интегрируется с Mistral Search Toolkit. В тестах OCR 4 показал высокие результаты и получил предпочтение независимых комментаторов.

LLM

читать → 1 просмотр

arXiv cs.AI 26 Jun 2026

Новый подход к управлению ИИ: как контролировать автономные системы без слежки за их рассуждениями

Предложена модель управления ИИ-агентами: агенты автономны в рассуждениях, но рискованные действия требуют подтверждений от независимых источников и фиксируются в защищённом журнале.

LLM Safety Research

читать → 1 просмотр

arXiv cs.AI 26 Jun 2026

LLM-конвейер раскрывает секреты управления в агентных системах

Разработан конвейер на базе LLM для анализа управления в агентных системах ИИ. Протестирован на ERC-8004 и Google A2A: выявлены общие черты неравенства и фрагментации, а также тенденция к тематической конвергенции при открытом управлении.

LLM Research Agents

читать → 1 просмотр

arXiv cs.AI 26 Jun 2026

ИИ-платформа раскрывает данные о побочных эффектах антидепрессантов

Создана ИИ-платформа, объединяющая официальные отчёты и данные от пациентов о лекарствах для психического здоровья; выявлены более ранние сигналы о побочных эффектах в сообществах.

LLM Research Safety

читать → 1 просмотр

Google AI Blog 26 Jun 2026

Google I/O 2026: главные новинки — от Gemini до интеллектуальных очков

На Google I/O 2026 компания представила новые модели ИИ (Gemini Omni, Gemini 3.5 Flash), информационных агентов в поиске, обновлённый интерфейс Gemini (Neural Expressive), персонального ИИ‑агента Gemini Spark и другие разработки. Среди новинок — ежедневная сводка в приложении Gemini, универсальная корзина покупок и интеллектуальные очки для Android XR.

LLM Multimodal Agents

читать → 1 просмотр

Google AI Blog 26 Jun 2026

Gemini Omni и Gemini 3.5: 9 демонстраций возможностей

На Google I/O 2026 представили модели Gemini Omni и семейство Gemini 3.5. Gemini Omni позволяет создавать и редактировать видео, комбинируя разные типы данных. Версия 3.5 Flash отличается высокой производительностью и подходит для сложных задач — её интегрировали в приложение Gemini и поиск. Также появился персональный агент Gemini Spark.

LLM Multimodal Agents

читать → 1 просмотр