Deep Digest — AI на русском

LLM

87 статьи по теме

arXiv cs.CL 26 Jun 2026

LLM сужают выбор методов исследований: новое исследование выявило риски

Исследование показало, что LLM (GPT-5.1, Gemini 3 Pro, DeepSeek-V3.2) предлагают слишком узкий набор методов для исследований, есть перекосы в выборе подходов — это несёт риски для учёных.

LLM Research

читать → 1 просмотр

arXiv cs.CL 26 Jun 2026

Большие языковые модели: в чём их ключевое преимущество?

Разработана платформа AdvCluster для анализа преимуществ крупных языковых моделей; доказано, что они эффективнее работают с ограничениями в логических задачах.

LLM Research

читать → 1 просмотр

arXiv cs.CL 26 Jun 2026

Эмоциональные аватары на языке жестов: новый способ общения на непальском

Создан мультимодальный фреймворк NEST-V1: он превращает непальские слова в жесты аватаров с учётом эмоций. Точность распознавания речи — 81,1%, эмоций — 79,21%.

Multimodal Research LLM

читать → 1 просмотр

arXiv cs.CL 26 Jun 2026

Dynamic-dLLM: в 3 раза быстрее — новый способ ускорить работу диффузионных LLM

Dynamic-dLLM ускоряет работу диффузионных LLM более чем в 3 раза за счёт динамического обновления кэша и адаптивного декодирования. Протестировано на LLaDA и Dream, в системах MMLU, GSM8K, HumanEval.

LLM Research

читать → 1 просмотр

arXiv cs.CL 26 Jun 2026

Как стиль текста влияет на мнение нейросети о защите животных

Исследование показало, как разные стили текста влияют на позицию языковой модели Llama‑3.2‑1B в вопросах защиты животных. Чёткая аргументация усиливает поддержку, сдержанный стиль — ослабляет.

LLM Research

читать → 1 просмотр

arXiv cs.CL 26 Jun 2026

LLM научили вести диалог без эскалации конфликта

Разработан метод снижения эскалации конфликтов в диалогах с LLM за счёт подсказок на основе принципов ненасильственного общения (NVC).

LLM Safety Research

читать → 1 просмотр

arXiv cs.CL 26 Jun 2026

ContextForge: система, которая продлит диалоги с LLM

Дерек Томас разработал ContextForge — систему для эффективного использования контекста в долгих диалогах с LLM. Она экономит токены и сохраняет качество ответов.

LLM Research

читать → 1 просмотр

arXiv cs.CV 26 Jun 2026

ForeAgent: агент, который учится распознавать поддельные ИИ‑изображения

ForeAgent — система для выявления поддельных ИИ‑изображений, которая постоянно учится и показывает высокую точность в тестах (до 93,3%)

Vision LLM Research

читать → 1 просмотр

arXiv cs.CV 26 Jun 2026

CRISP: новый способ проверить, насколько ИИ понимает пространство и образы

CRISP — метод оценки визуально‑пространственного интеллекта ИИ с помощью 3D‑графиков и протокола oracle, позволяющий отделить логическое мышление от проблем восприятия.

Vision LLM Research

читать → 1 просмотр

arXiv cs.CV 26 Jun 2026

Новый метод борьбы с ошибками в мультимодальных ИИ-моделях

Система VIGIL улучшает связь между текстом и изображениями в мультимодальных ИИ-моделях, снижая число ошибок и галлюцинаций. Требует меньше данных, чем аналоги.

LLM Vision Research

читать → 1 просмотр

arXiv cs.CV 26 Jun 2026

GeMoE: новый способ оптимизировать работу больших моделей VisionLanguage

GeMoE — метод адаптивной маршрутизации для моделей VisionLanguage на базе MoE: повышает эффективность использования ресурсов, сохраняя производительность и увеличивая частоту активации экспертов.

LLM Vision Research

читать → 1 просмотр

arXiv cs.LG 26 Jun 2026

«Красная королева» ускоряет самосовершенствование ИИ-агентов

Платформа RQGM позволяет ИИ‑агентам эффективнее самосовершенствоваться за счёт динамической смены критериев оценки. Показала лучшие результаты в кодировании, написании и рецензировании статей и др.

LLM Research Agents

читать → 1 просмотр

arXiv cs.LG 26 Jun 2026

Mesh-RL: новый способ ускорить обучение нейросетей в сложных средах

Mesh-RL ускоряет обучение с подкреплением за счёт разбиения среды на подсети — повышает скорость сходимости и стабильность в Q-learning, SARSA, Dyna-Q.

Research LLM

читать → 1 просмотр

arXiv cs.LG 26 Jun 2026

Новый адаптер HRM превзошёл LoRa в задачах с длинным контекстом

Представлен адаптер HRM для SSM-моделей — он эффективнее LoRa в задачах с длительным контекстом, показал рост точности на 34,8–71,6% в тестах на Mistral-7B.

LLM Research

читать → 1 просмотр

arXiv cs.LG 26 Jun 2026

EVOM: ИИ-агент самостоятельно создаёт эффективные архитектуры для обучения с подкреплением

Фреймворк EVOM автоматически создаёт архитектуры для обучения с подкреплением «актёр-критик», превосходя ручные методы и другие подходы. Тестировался на Ant-v4 и HalfCheetah-v4.

LLM Research Agents

читать → 1 просмотр

arXiv cs.LG 26 Jun 2026

Графовые нейросети раскрывают алгебраические тайны групп

Новая структура на базе GNN позволяет извлекать алгебраические свойства групп из их графовых представлений (графов Кэли).

Research LLM

читать → 1 просмотр

arXiv cs.LG 26 Jun 2026

Новый метод улучшения нейросетей: симметрия и расширение данных

Разработаны методы повышения симметрии в байесовских нейросетях за счёт расширения данных; один из методов показал преимущество перед базовым подходом.

Research LLM

читать → 1 просмотр

arXiv cs.LG 26 Jun 2026

Новый метод раскроет, какие данные использовали для обучения ИИ

Предложен метод оценки доли данных, использованных для обучения ИИ-модели, без сложных дополнительных моделей и скрытых данных. Протестирован на моделях генерации изображений.

Research LLM Vision

читать → 1 просмотр

arXiv cs.LG 26 Jun 2026

Fast-LeWM: новая модель ускорит планирование действий в визуальных системах

Fast-LeWM ускоряет планирование действий в визуальных системах и снижает накопление ошибок по сравнению с LeWM.

Vision Research LLM

читать → 1 просмотр

arXiv cs.LG 26 Jun 2026

Новый метод обучения ИИ: баланс точности, скорости и защиты данных

Модель FHPLF объединяет обучение хэшированию и федеративное обучение, снижая затраты на вычисления и повышая защиту данных при сохранении высокой точности.

Research Safety LLM

читать → 1 просмотр