DeepDigest

// AI-дайджест с западных источников

Главное об ИИ — уже на русском

▸ LIVE: OpenAI: выручка растёт, но убытки остаются огромными
@deepdigest
Статьи об ИИ в Telegram — подпишитесь, чтобы читать первым
Подписаться →
// самые читаемые
#1
Facebook Creator Studio была возрождена в качестве приложения-...
30 просм.
#2
Битва за Алекса Бореса: технологичные гиганты потратили 27 млн...
18 просм.
#3
OpenAI и Broadcom представили оптимизированный для LLM чип лог...
12 просм.
#4
Ускорение обучения моделей MoE: как автомодель NVIDIA NeMo мен...
11 просм.
#5
Новый уровень инфраструктуры веб-данных: как это изменит искус...
8 просм.
arXiv cs.CV

PhyEditBench: новый тест для проверки «физического мышления» моделей редактирования фото

PhyEditBench — тест для оценки физического понимания моделей редактирования изображений. Включает 238 реальных и 35 синтетических примеров. Представлена программа PhyWorld, превосходящая аналоги.

читать → 0 просмотра
arXiv cs.CV

CRISP: новый способ проверить, насколько ИИ понимает пространство и образы

CRISP — метод оценки визуально‑пространственного интеллекта ИИ с помощью 3D‑графиков и протокола oracle, позволяющий отделить логическое мышление от проблем восприятия.

читать → 0 просмотра
arXiv cs.CV

Новый метод создаёт длинные видеоролики: забывание и адаптация в деле

Разработана сеть FFN для обработки многочасовых видеороликов: модель адаптируется, работая всего с тремя кадрами, и использует новую метрику для оптимизации обработки. Создан датасет EpicTours (до 3 часов).

читать → 0 просмотра
arXiv cs.CV

DinoLink: в 139 раз меньше данных — новое решение для связи автомобиля с инфраструктурой

DinoLink — платформа для сжатия данных в системах V2X: снижает объём передаваемой информации в 139 раз, сохраняет качество данных, ускоряет работу в узкополосных средах.

читать → 0 просмотра
arXiv cs.CV

GeMoE: новый способ оптимизировать работу больших моделей VisionLanguage

GeMoE — метод адаптивной маршрутизации для моделей VisionLanguage на базе MoE: повышает эффективность использования ресурсов, сохраняя производительность и увеличивая частоту активации экспертов.

читать → 0 просмотра
arXiv cs.CV

Новый метод настройки визуальных моделей: гибридное слияние данных даёт лучший результат

Разработан метод гибридного слияния данных для настройки моделей зрения, который эффективнее прежних подходов — протестирован на 34 наборах данных, показывает лучшее соотношение точности и задержки.

читать → 0 просмотра
arXiv cs.CV

Нейросеть предскажет качество лазерной сварки: точность до 99,35%

Новая нейросеть с высокой точностью прогнозирует параметры лазерной сварки, анализируя изображения сварочной ванны и параметры процесса. Точность прогнозирования состояния проплавления — 99,35%.

читать → 0 просмотра
arXiv cs.CV

Новый подход к анализу когнитивных задач с помощью МРТ: от «один к одному» к «многие к одному»

Разработан метод анализа когнитивных задач через МРТ: от переноса данных «один к одному» к анализу связей «многие к одному» с применением BIP и 1127 моделей.

читать → 0 просмотра
arXiv cs.CV

DocArena: как превратить документы в обучающую среду для поисковых агентов

DocArena — система для создания обучающих сред из документов для агентов поиска; включает набор данных DocArena-79K и инфраструктуру Doc-Search agent; показывает высокие результаты в поиске и контроле качества.

читать → 2 просмотра
// еженедельный дайджест на email
темы: