DeepDigest

// AI-дайджест с западных источников

Главное об ИИ — уже на русском

▸ LIVE: Vivo X Fold6: складной экран для «телефона-агента»
@deepdigest
Статьи об ИИ в Telegram — подпишитесь
Подписаться →
@deepdigest · Макс
Статьи об ИИ в Макс — подпишитесь
Подписаться →
Дзен
deepdigest · Дзен
Статьи об ИИ в Яндекс Дзен — подпишитесь
Подписаться →
// самые читаемые
#1
Как агенты трансформируют работу
2495 просм.
#2
Ускорение Gemini Nano на Pixel с мультитокеновым прогнозированием
2459 просм.
#3
Викторина по вводу-выводу 2026 от Google AI Studio
2391 просм.
#4
Использование искусственного интеллекта для помощи врачам в ди...
2371 просм.
#5
Daybreak: инструменты для обеспечения безопасности любой орган...
2355 просм.

Корпоративный RAG: философия построения системы на основе экспертных знаний

Анджела Ши описывает философию построения корпоративных систем RAG, подчёркивая, что такие системы должны усиливать, а не заменять экспертов. В основе архитектуры — четыре элемента (синтаксический анализ, анализ вопросов, поиск, генерация), каждый из которых должен отражать действия эксперта. Автор выделяет четыре условия и три принципа для эффективной реализации системы.

читать →
~2 мин 39 просмотра

Gemma 4: от локального LLM до агента с инструментами

Пост посвящён созданию локального ИИ-агента с использованием различных инструментов. В качестве LLM задействована модель Gemma 4, для обслуживания модели применяется Ollama, среда выполнения агента строится на OpenAI Agents SDK, а в качестве внешнего инструмента — Tavily MCP. В результате получится агент, способный искать информацию в сети и синтезировать ответы.

LLM
читать →
~1 мин 34 просмотра

Как создать базу знаний на базе LLM

Статья посвящена созданию базы знаний на базе LLM. Автор объясняет, почему такие базы становятся всё мощнее благодаря технологиям LLM, и описывает способы автоматического внесения и активного использования информации. Рассмотрены два подхода к работе с базой: активный запрос и пассивное использование инструментом в процессе работы.

LLM
читать →
~2 мин 71 просмотра

GPT-агенты и маршрутизация: ловушка Парето при оптимизации затрат

Команда сократила расходы на ИИ за счёт маршрутизации запросов между дешёвой и дорогой моделями, но через несколько месяцев заметила падение удовлетворённости клиентов и рост оттока. Проблема в том, что существующая система измерений не позволяла отследить разрыв в качестве на разных уровнях маршрутизации. В качестве решения предложен каскадный подход к обработке запросов.

читать →
~2 мин 76 просмотра
// еженедельный дайджест на email
темы:
// помочь проекту