Новый метод извлекает задачи и методы из научных статей с повышенной точностью
Разработан метод извлечения задач и методов из научных статей — он повышает точность (рост F1 на 2,67–3,71%) за счёт десенсибилизации выражений и учёта контекста.
87 статьи по теме
Разработан метод извлечения задач и методов из научных статей — он повышает точность (рост F1 на 2,67–3,71%) за счёт десенсибилизации выражений и учёта контекста.
SOLAR — метод выравнивания представлений токенов в многоязычных моделях, повышающий согласованность ответов на разных языках и точность анализа.
Создан тест MKG-RAG-Bench для оценки работы систем RAG с мультимодальными графами знаний; поможет совершенствовать ИИ-решения.
Учёные выяснили, как ИИ-модель анализирует полярное сияние: она учитывает сезонные циклы и трёхмерную структуру штормов, самостоятельно выявляя метеорологические закономерности.
Кайли Энглин предложила методы для более точной оценки неопределённости в работе классификаторов на основе LLM, особенно при работе с небольшими выборками и вложенными данными.
OpenAI демонстрирует быстрый рост выручки, однако расходы компании, особенно на НИОКР, остаются значительно выше доходов. Ежедневные операционные и чистый убытки продолжают расти. Чтобы выйти на прибыль к 2030 году, OpenAI придётся оптимизировать затраты и повысить отдачу от инвестиций.
Пентагон начал использовать инструменты ИИ для подготовки отчётов для Конгресса — это позволяет существенно сократить время на их составление. Число сотрудников Минобороны, применяющих средства ИИ, резко выросло. Эксперты предупреждают о рисках ошибок в таких отчётах.
Кори Доктороу в новой книге рассуждает о рисках, связанных с развитием ИИ, и вводит понятие «обратного кентавра» — ситуации, когда человек становится вспомогательным элементом для машины. Автор обеспокоен чрезмерными инвестициями в ИИ и возможными экономическими последствиями «лопания пузыря» в этой сфере. Он также связывает популярность ИИ с мечтой о полностью автономных системах.
Берни Сандерс выдвинул план создания суверенного фонда за счёт 50‑процентного налога на акции крупнейших ИИ‑компаний. Фонд может достичь 7 трлн долларов, средства направят на выплаты гражданам и финансирование социальных программ. Представители индустрии ИИ не разделяют радикальности предложений сенатора.
Anthropic приостановила запланированное повышение тарифов для Claude Agent SDK — пользователи сохранят прежние условия. Изменения, анонсированные на 15 июня, могли увеличить расходы активных пользователей, в том числе тех, кто использует сторонние приложения. Решение принято на фоне изменений в тарификации GitHub Copilot и подготовки Anthropic к IPO.
Авторы эссе доказывают, что опасения по поводу замены инженеров-программистов ИИ преувеличены. На примерах из бизнеса показано, что увольнения часто объясняют влиянием ИИ, хотя реальные причины иные. Данные исследований также не подтверждают массового сокращения рабочих мест из‑за внедрения ИИ.
Локеш Лагуду из IEEE и Walmart Global Tech дал советы начинающим инженерам, как преуспеть в сфере ИИ. Он рекомендует осваивать технические навыки, изучать принципы работы LLM и GPT, участвовать в бенчмарках и применять знания на практике. Также важно следить за исследованиями и развивать междисциплинарные навыки.
Ванесса Бейтс Рамирес призывает оценивать влияние моделей ИИ не только по их производительности, но и по тому, как они воздействуют на общество. Эксперт считает, что нужны специальные показатели для анализа социальных последствий применения ИИ. Это поможет лучше понимать последствия внедрения технологий.
ProvenAI — фреймворк для оценки соответствия ответов ИИ источникам: проверяет правильность, цитирование и влияние источников. Тестировался на HotpotQA, показал точность ответов 53,53 %, цитирования — 71,55 %.
AnySimLite — лёгкая модель для классификации речи на устройствах: занимает мало памяти, сохраняет высокую точность. Показала конкурентоспособные результаты.
ProfileFoundry — генератор синтетических данных для оценки работы LLM-агентов: память, конфиденциальность, работа с документами. 100 тыс. профилей, более 700 тыс. событий.
Небольшие языковые модели ускоряют анализ данных о spHRI, помогая обнаруживать пропущенные рецензентами статьи.
ConflictScore — метрика для оценки реакции языковых моделей на противоречивые данные; включает тест ConflictBench и показатели CS-C и CS-R.
Авторы представили систематический обзор объединения зрительного восприятия и языкового мышления в MLLM, ввели пятиэтапную таксономию и обозначили перспективы создания унифицированного мультимодального интеллекта.
Разработан метод создания диалоговых ИИ‑систем для языков с ограниченными ресурсами на базе WordNet: преобразовали Hindi WordNet в 1,25 млн пар «инструкция‑ответ», настроили языковую модель — эффективность достигла 91,0.