MCP и RAG: как агенты ИИ незаметно отправляют данные в облако

Вы когда‑нибудь задумывались, какие файлы на вашем компьютере считывают агенты искусственного интеллекта (например, Claude Code, Cursor, Cline) и куда отправляется их содержимое? Когда вы используете таких агентов, они могут автономно считывать файлы, выполнять команды и отправлять данные в облако — и вы не всегда можете контролировать этот процесс. Это создаёт риски, особенно при работе с соглашениями о неразглашении (NDA).

Есть два ключевых механизма, которые расширяют возможности агентов ИИ: MCP (механизм для вызова внешних файлов, инструментов и SaaS из ИИ) и RAG (механизм для поиска документов и получения ответов на вопросы).

Проблема MCP в том, что размывается граница между локальным и облачным выполнением задач. В контекст ИИ могут попасть подробные журналы ошибок, данные отладки, токены аутентификации и личная информация — и всё это отправится в облако, даже если вы не планировали этого. К тому же MCP динамически взаимодействует с внешним миром: даже при одинаковом запросе содержимое, отправляемое в облако, может меняться из‑за изменения исходных данных. Это усложняет аудит действий агента.

У RAG свои риски. Во‑первых, ИИ может безоговорочно доверять внешним документам и выполнять содержащиеся в них инструкции (например, «игнорировать предыдущие инструкции»). Во‑вторых, при поиске информации могут обнаружиться документы с конфиденциальными данными, не относящимися к запросу. В‑третьих, чем шире контекст (чем больше подключено инструментов и документов), тем слабее контроль за безопасностью — ИИ может случайно раскрыть секреты.

Традиционные системы предотвращения потери данных (DLP) здесь малоэффективны: они ориентированы на поиск фиксированных шаблонов (например, номеров карт), а взаимодействие с ИИ происходит на естественном языке, где конфиденциальность определяется контекстом. Поэтому подходы к защите данных меняются. Среди тестируемых решений — шлюзы между агентом и облачным ИИ (с проверкой содержимого перед отправкой), мониторинг поведения агентов, отслеживание источника данных, изоляция вычислений в зашифрованных зонах и локальная обработка данных.

Граница безопасности теперь проходит не между внутренней и внешней сетями, а там, где ИИ вызывает и отправляет данные. Защита смещается от простого обнаружения угроз к оценке того, стоит ли обнародовать информацию. Ключевой принцип — действовать так, чтобы в будущем можно было объяснить, какие данные и куда были отправлены. Для этого нужно чётко прописывать политику обработки данных, локально обрабатывать конфиденциальную информацию и вести записи о том, что было отправлено в облако, а что осталось локально.