DeepDigest
← все источники

arXiv cs.AI

4 статьи на русском

arXiv cs.AI

Новый подход к прогнозированию: как избежать искажений в оценках вероятностей

Йобст Хайциг разработал способ для ИИ-«оракула», позволяющий давать объективные и самосогласованные оценки вероятностей событий, избегая искажений из‑за самореференции. Метод основан на теории решёток.

читать → 0 просмотра
arXiv cs.AI

Агенты оптимизируют работу парка электробусов: новый подход к координации

Разработана система агрегатора агентов для оптимизации работы парка электробусов — она в реальном времени корректирует тарифы и расписание с учётом разных факторов.

читать → 0 просмотра
arXiv cs.AI

Новый метод поиска решений в комбинаторной геометрии: MCTS с учётом геометрии

Разработан метод MCTS для решения экстремальных задач комбинаторной геометрии: он учитывает геометрические ограничения и использует симметрии для ускорения поиска решений, что позволило получить новые результаты по ряду задач.

читать → 0 просмотра
arXiv cs.AI

Пробелы в оценке мультимодальных ИИ: что мешает оценить реальные возможности моделей?

Исследование выявило пробелы в оценке мультимодальных ИИ-моделей (MLLM): нынешние методы не показывают, как модели объединяют данные из разных источников (текст, фото, аудио и др.).

читать → 0 просмотра
arXiv cs.AI

Скрытое влияние: как редактирование одного модуля меняет работу всей агентной системы

Обнаружена проблема в агентных системах: изменение одного модуля может незаметно влиять на другие (CBL). Протестировано на Claude Sonnet 4.6, предложен протокол для выявления сбоев.

читать → 0 просмотра
arXiv cs.AI

Новый подход к этическим рассуждениям в ИИ: система «изложение мыслей»

Разработана система NoT для структурирования этических рассуждений в ИИ: она снижает число упущенных факторов в моральных дилеммах и помогает достигать консенсуса в дебатах.

читать → 0 просмотра
arXiv cs.AI

QES: новый подход к научным открытиям в эпоху ускоряющегося прогресса

Статья предлагает Qualitative Engine for Science (QES) как способ преодолеть ограничения ускорения технологического прогресса в научных открытиях и сократить разрыв между ИИ и человеческим мышлением.

читать → 0 просмотра
arXiv cs.AI

Агенты LLM прошли испытание на задачах энергетической аналитики

Агенты на базе LLM протестированы на 243 задачах энергетической аналитики — от анализа данных до сложного моделирования; сравнивались модели с закрытым и открытым кодом.

читать → 0 просмотра
arXiv cs.AI

Проверка решений в кодировании: почему «серебряной пули» не существует

Авторы исследовали проблемы проверки решений в кодировании при развитии ИИ и предложили 4 схемы вознаграждения для верификации задач. Эксперименты подтвердили эффективность подхода.

читать → 0 просмотра
arXiv cs.AI

COrigami: ИИ поможет создать узнаваемое оригами

Система COrigami на базе ИИ создаёт шаблоны оригами по текстовому описанию, объединяя алгоритмическую оптимизацию и эстетическую оценку — помощник для художников в проектировании сложных форм.

читать → 0 просмотра
arXiv cs.AI

Новый подход к управлению ИИ: как контролировать автономные системы без слежки за их рассуждениями

Предложена модель управления ИИ-агентами: агенты автономны в рассуждениях, но рискованные действия требуют подтверждений от независимых источников и фиксируются в защищённом журнале.

читать → 0 просмотра
arXiv cs.AI

LLM-конвейер раскрывает секреты управления в агентных системах

Разработан конвейер на базе LLM для анализа управления в агентных системах ИИ. Протестирован на ERC-8004 и Google A2A: выявлены общие черты неравенства и фрагментации, а также тенденция к тематической конвергенции при открытом управлении.

читать → 0 просмотра
arXiv cs.AI

ИИ-платформа раскрывает данные о побочных эффектах антидепрессантов

Создана ИИ-платформа, объединяющая официальные отчёты и данные от пациентов о лекарствах для психического здоровья; выявлены более ранние сигналы о побочных эффектах в сообществах.

читать → 0 просмотра
arXiv cs.AI

Персонаж в чате влияет на отказ: новое открытие в работе ИИ-моделей

Учёные доказали: поведение ИИ-моделей (в т. ч. склонность к отказу) зависит от заданного образа персонажа; эксперименты с Qwen и Llama показали резкое снижение отказов при покладистом образе.

читать → 0 просмотра
arXiv cs.AI

Новый взгляд на оценку ИИ: что скрывается за максимальной точностью?

Авторы предложили оценивать ИИ-агентов не только по точности, но и по другим параметрам (надёжность, эффективность и др.), представив обновлённый тест CORE-Bench и выявив ускорение решения задач при взаимодействии человека и агента.

читать → 2 просмотра