Deep Digest — AI на русском

LLM

87 статьи по теме

arXiv cs.CL 27 Jun 2026

Новый метод извлекает задачи и методы из научных статей с повышенной точностью

Разработан метод извлечения задач и методов из научных статей — он повышает точность (рост F1 на 2,67–3,71%) за счёт десенсибилизации выражений и учёта контекста.

LLM Research

читать → 0 просмотра

arXiv cs.CL 27 Jun 2026

SOLAR: новый способ устранить языковые расхождения в ИИ-моделях

SOLAR — метод выравнивания представлений токенов в многоязычных моделях, повышающий согласованность ответов на разных языках и точность анализа.

LLM Research Multimodal

читать → 0 просмотра

arXiv cs.AI 27 Jun 2026

MKG-RAG-Bench: новый тест для оценки мультимодального поиска в ИИ-системах

Создан тест MKG-RAG-Bench для оценки работы систем RAG с мультимодальными графами знаний; поможет совершенствовать ИИ-решения.

LLM Research Multimodal

читать → 0 просмотра

arXiv cs.LG 27 Jun 2026

ИИ раскрывает секреты полярного сияния: как модель «видит» атмосферу

Учёные выяснили, как ИИ-модель анализирует полярное сияние: она учитывает сезонные циклы и трёхмерную структуру штормов, самостоятельно выявляя метеорологические закономерности.

Research LLM Vision

читать → 0 просмотра

arXiv cs.AI 27 Jun 2026

Новый подход к оценке точности языковых моделей: как избежать ошибок в анализе текстов

Кайли Энглин предложила методы для более точной оценки неопределённости в работе классификаторов на основе LLM, особенно при работе с небольшими выборками и вложенными данными.

LLM Research Safety

читать → 0 просмотра

Ars Technica AI 26 Jun 2026

OpenAI: выручка растёт, но убытки остаются огромными

OpenAI демонстрирует быстрый рост выручки, однако расходы компании, особенно на НИОКР, остаются значительно выше доходов. Ежедневные операционные и чистый убытки продолжают расти. Чтобы выйти на прибыль к 2030 году, OpenAI придётся оптимизировать затраты и повысить отдачу от инвестиций.

LLM Business Research

читать → 1 просмотр

Ars Technica AI 26 Jun 2026

Пентагон использует ИИ для подготовки отчётов для Конгресса

Пентагон начал использовать инструменты ИИ для подготовки отчётов для Конгресса — это позволяет существенно сократить время на их составление. Число сотрудников Минобороны, применяющих средства ИИ, резко выросло. Эксперты предупреждают о рисках ошибок в таких отчётах.

LLM

читать → 1 просмотр

Ars Technica AI 26 Jun 2026

Кори Доктороу о рисках пузыря ИИ и концепции «обратного кентавра»

Кори Доктороу в новой книге рассуждает о рисках, связанных с развитием ИИ, и вводит понятие «обратного кентавра» — ситуации, когда человек становится вспомогательным элементом для машины. Автор обеспокоен чрезмерными инвестициями в ИИ и возможными экономическими последствиями «лопания пузыря» в этой сфере. Он также связывает популярность ИИ с мечтой о полностью автономных системах.

LLM

читать → 1 просмотр

Ars Technica AI 26 Jun 2026

Берни Сандерс предложил план контроля над индустрией ИИ за 7 трлн долларов

Берни Сандерс выдвинул план создания суверенного фонда за счёт 50‑процентного налога на акции крупнейших ИИ‑компаний. Фонд может достичь 7 трлн долларов, средства направят на выплаты гражданам и финансирование социальных программ. Представители индустрии ИИ не разделяют радикальности предложений сенатора.

LLM Business Research

читать → 1 просмотр

Ars Technica AI 26 Jun 2026

Anthropic приостановила изменение тарифов для Claude Agent SDK

Anthropic приостановила запланированное повышение тарифов для Claude Agent SDK — пользователи сохранят прежние условия. Изменения, анонсированные на 15 июня, могли увеличить расходы активных пользователей, в том числе тех, кто использует сторонние приложения. Решение принято на фоне изменений в тарификации GitHub Copilot и подготовки Anthropic к IPO.

LLM

читать → 1 просмотр

AI Snake Oil 26 Jun 2026

GPT-4 и другие ИИ: почему не заменят инженеров-программистов

Авторы эссе доказывают, что опасения по поводу замены инженеров-программистов ИИ преувеличены. На примерах из бизнеса показано, что увольнения часто объясняют влиянием ИИ, хотя реальные причины иные. Данные исследований также не подтверждают массового сокращения рабочих мест из‑за внедрения ИИ.

LLM Business Research

читать → 1 просмотр

IEEE Spectrum AI 26 Jun 2026

7 способов преуспеть в ИИ: советы для начинающих инженеров

Локеш Лагуду из IEEE и Walmart Global Tech дал советы начинающим инженерам, как преуспеть в сфере ИИ. Он рекомендует осваивать технические навыки, изучать принципы работы LLM и GPT, участвовать в бенчмарках и применять знания на практике. Также важно следить за исследованиями и развивать междисциплинарные навыки.

LLM Research Business

читать → 1 просмотр

IEEE Spectrum AI 26 Jun 2026

Как измерить влияние ИИ на общество: призыв эксперта

Ванесса Бейтс Рамирес призывает оценивать влияние моделей ИИ не только по их производительности, но и по тому, как они воздействуют на общество. Эксперт считает, что нужны специальные показатели для анализа социальных последствий применения ИИ. Это поможет лучше понимать последствия внедрения технологий.

LLM

читать → 1 просмотр

arXiv cs.CL 26 Jun 2026

ProvenAI: как проверить, откуда взялись ответы ИИ

ProvenAI — фреймворк для оценки соответствия ответов ИИ источникам: проверяет правильность, цитирование и влияние источников. Тестировался на HotpotQA, показал точность ответов 53,53 %, цитирования — 71,55 %.

LLM Research Safety

читать → 1 просмотр

arXiv cs.CL 26 Jun 2026

AnySimLite: новый способ классификации речи на смартфоне без потери качества

AnySimLite — лёгкая модель для классификации речи на устройствах: занимает мало памяти, сохраняет высокую точность. Показала конкурентоспособные результаты.

LLM Audio Research

читать → 1 просмотр

arXiv cs.CL 26 Jun 2026

ProfileFoundry: новый инструмент для тестирования LLM-агентов

ProfileFoundry — генератор синтетических данных для оценки работы LLM-агентов: память, конфиденциальность, работа с документами. 100 тыс. профилей, более 700 тыс. событий.

LLM Research Agents

читать → 1 просмотр

arXiv cs.CL 26 Jun 2026

Небольшие языковые модели ускоряют анализ данных о взаимодействии человека и робота

Небольшие языковые модели ускоряют анализ данных о spHRI, помогая обнаруживать пропущенные рецензентами статьи.

Research LLM Robotics

читать → 1 просмотр

arXiv cs.CL 26 Jun 2026

ConflictScore: новый способ оценить, как языковые модели справляются с противоречиями

ConflictScore — метрика для оценки реакции языковых моделей на противоречивые данные; включает тест ConflictBench и показатели CS-C и CS-R.

LLM Research

читать → 1 просмотр

arXiv cs.CL 26 Jun 2026

Новый взгляд на взаимодействие зрения и языка в ИИ: систематизированный обзор мультимодальных моделей

Авторы представили систематический обзор объединения зрительного восприятия и языкового мышления в MLLM, ввели пятиэтапную таксономию и обозначили перспективы создания унифицированного мультимодального интеллекта.

LLM Multimodal Research

читать → 1 просмотр

arXiv cs.CL 26 Jun 2026

ИИ для языков с ограниченными ресурсами: новый подход на основе WordNet

Разработан метод создания диалоговых ИИ‑систем для языков с ограниченными ресурсами на базе WordNet: преобразовали Hindi WordNet в 1,25 млн пар «инструкция‑ответ», настроили языковую модель — эффективность достигла 91,0.

LLM Research Multimodal

читать → 1 просмотр