DeepDigest
← все статьи
LLM

LLM

87 статьи по теме

arXiv cs.CL

LLM сужают выбор методов исследований: новое исследование выявило риски

Исследование показало, что LLM (GPT-5.1, Gemini 3 Pro, DeepSeek-V3.2) предлагают слишком узкий набор методов для исследований, есть перекосы в выборе подходов — это несёт риски для учёных.

читать → 1 просмотр
arXiv cs.CL

Эмоциональные аватары на языке жестов: новый способ общения на непальском

Создан мультимодальный фреймворк NEST-V1: он превращает непальские слова в жесты аватаров с учётом эмоций. Точность распознавания речи — 81,1%, эмоций — 79,21%.

читать → 1 просмотр
arXiv cs.CL

Dynamic-dLLM: в 3 раза быстрее — новый способ ускорить работу диффузионных LLM

Dynamic-dLLM ускоряет работу диффузионных LLM более чем в 3 раза за счёт динамического обновления кэша и адаптивного декодирования. Протестировано на LLaDA и Dream, в системах MMLU, GSM8K, HumanEval.

читать → 1 просмотр
arXiv cs.CL

Как стиль текста влияет на мнение нейросети о защите животных

Исследование показало, как разные стили текста влияют на позицию языковой модели Llama‑3.2‑1B в вопросах защиты животных. Чёткая аргументация усиливает поддержку, сдержанный стиль — ослабляет.

читать → 1 просмотр
arXiv cs.CV

CRISP: новый способ проверить, насколько ИИ понимает пространство и образы

CRISP — метод оценки визуально‑пространственного интеллекта ИИ с помощью 3D‑графиков и протокола oracle, позволяющий отделить логическое мышление от проблем восприятия.

читать → 1 просмотр
arXiv cs.CV

GeMoE: новый способ оптимизировать работу больших моделей VisionLanguage

GeMoE — метод адаптивной маршрутизации для моделей VisionLanguage на базе MoE: повышает эффективность использования ресурсов, сохраняя производительность и увеличивая частоту активации экспертов.

читать → 1 просмотр
arXiv cs.LG

«Красная королева» ускоряет самосовершенствование ИИ-агентов

Платформа RQGM позволяет ИИ‑агентам эффективнее самосовершенствоваться за счёт динамической смены критериев оценки. Показала лучшие результаты в кодировании, написании и рецензировании статей и др.

читать → 1 просмотр
arXiv cs.LG

EVOM: ИИ-агент самостоятельно создаёт эффективные архитектуры для обучения с подкреплением

Фреймворк EVOM автоматически создаёт архитектуры для обучения с подкреплением «актёр-критик», превосходя ручные методы и другие подходы. Тестировался на Ant-v4 и HalfCheetah-v4.

читать → 1 просмотр
arXiv cs.LG

Новый метод раскроет, какие данные использовали для обучения ИИ

Предложен метод оценки доли данных, использованных для обучения ИИ-модели, без сложных дополнительных моделей и скрытых данных. Протестирован на моделях генерации изображений.

читать → 1 просмотр