Deep Digest

Towards Data Science 28 Jun 2026

Корпоративный RAG: философия построения системы на основе экспертных знаний

Анджела Ши описывает философию построения корпоративных систем RAG, подчёркивая, что такие системы должны усиливать, а не заменять экспертов. В основе архитектуры — четыре элемента (синтаксический анализ, анализ вопросов, поиск, генерация), каждый из которых должен отражать действия эксперта. Автор выделяет четыре условия и три принципа для эффективной реализации системы.

LLM Research Business

читать →

~2 мин 39 просмотра

Towards Data Science 28 Jun 2026

Gemma 4: от локального LLM до агента с инструментами

Пост посвящён созданию локального ИИ-агента с использованием различных инструментов. В качестве LLM задействована модель Gemma 4, для обслуживания модели применяется Ollama, среда выполнения агента строится на OpenAI Agents SDK, а в качестве внешнего инструмента — Tavily MCP. В результате получится агент, способный искать информацию в сети и синтезировать ответы.

LLM

читать →

~1 мин 34 просмотра

Towards Data Science 27 Jun 2026

Как создать базу знаний на базе LLM

Статья посвящена созданию базы знаний на базе LLM. Автор объясняет, почему такие базы становятся всё мощнее благодаря технологиям LLM, и описывает способы автоматического внесения и активного использования информации. Рассмотрены два подхода к работе с базой: активный запрос и пассивное использование инструментом в процессе работы.

LLM

читать →

~2 мин 71 просмотра

Towards Data Science 27 Jun 2026

GPT-агенты и маршрутизация: ловушка Парето при оптимизации затрат

Команда сократила расходы на ИИ за счёт маршрутизации запросов между дешёвой и дорогой моделями, но через несколько месяцев заметила падение удовлетворённости клиентов и рост оттока. Проблема в том, что существующая система измерений не позволяла отследить разрыв в качестве на разных уровнях маршрутизации. В качестве решения предложен каскадный подход к обработке запросов.

LLM Agents Research

читать →

~2 мин 76 просмотра

Главное об ИИ — уже на русском

Корпоративный RAG: философия построения системы на основе экспертных знаний

Gemma 4: от локального LLM до агента с инструментами

Как создать базу знаний на базе LLM

GPT-агенты и маршрутизация: ловушка Парето при оптимизации затрат