Deep Digest — AI на русском

Мультиагентные системы способны эффективнее справляться со сложными задачами, чем одиночные агенты, — за счёт распределения задач и снижения нагрузки на контекстное окно. С конца 2025 года мультиагентная экосистема активно развивается: появляются новые решения — от CrewAI и AutoGen до Edict. В качестве тестовой модели авторы статьи выбрали Kimi K2.6 — модель с открытым исходным кодом, оптимизированную для мультиагентных сценариев. В официальном документе Кими зафиксированы возможности: 300 субагентов, координация в 4000 шагов, многоагентная роевая оркестровка.

В ходе тестов K2.6 продемонстрировал способность не просто выдавать ответы, а брать на себя ответственность за планирование, выполнение задач, использование инструментов, получение обратной связи, корректировку маршрутов и предоставление результатов. Например, за 53 минуты модель создала браузерную версию прототипа macOS. Процесс включал несколько этапов: планирование, разделение задачи на модули (окружение рабочего стола, панель док-станции, панель меню, оконный менеджер, встроенные приложения и визуальные эффекты), назначение задач шести агентам и моделирование процесса совместной работы.

Агенты выполняли разные функции: один отвечал за инициализацию Vite, реагирование и проекты на TypeScript, настройку Tailwind CSS и создание системы управления состоянием ядра; другой — за рабочий стол, панель меню, док-станцию и оконные системы; третий — за встроенные приложения (Finder, Safari, Terminal и настройки). Кроме того, несколько агентов проводили проверку с точки зрения архитектуры кода, пользовательского интерфейса и оптимизации производительности, собирали отзывы и вносили улучшения.

В процессе разработки возникали проблемы — например, сбои при установке зависимостей (прерывание сетевого подключения npm, сбои команд установки). Однако K2.6 корректировал стратегию — например, переустанавливал зависимости с новым каталогом кэша — и доводил задачу до конца. После трёх раундов проверки и анализа (архитектура кода, пользовательский интерфейс/UX, оптимизация производительности) модель приступила к вторичной разработке: исправила проблему с конфигурацией Tailwind CSS версии 4, модифицировала компонент Window, добавила анимацию в окно, исправила логику, связанную с событиями перетаскивания, и заменила некоторые значки emoji на значки SVG в Lucide React.

Итоговый прототип позволяет открывать приложения (Finder, Terminal, Safari, VS Code, Настройки, калькулятор, заметки и др.), размещать их на рабочем столе на разных уровнях окон. Каждое окно имеет отдельную строку заголовка и кнопки управления, а общее расположение соответствует базовой логике настольной операционной системы.

Ещё два кейса из официального блога Кими демонстрируют возможности K2.6. В первом случае модель самостоятельно загрузила и развернула модель Qwen 3.5-0.8 B на локальном компьютере Mac, реализовала и оптимизировала логический вывод на языке Zig. Процесс длился более 12 часов, было обработано более 4000 обращений к инструменту, после 14 циклов итераций пропускная способность увеличилась с 15 токенов в секунду до 193 токенов в секунду (примерно на 20% быстрее, чем в LM Studio). Во втором случае K2.6 преобразовал exchange-core — механизм финансового сопоставления с открытым исходным кодом. Модель работала непрерывно 13 часов, реализовала более 12 стратегий оптимизации, инициировала более 1000 обращений к инструментам, изменила 4000 строк кода. В итоге топология потоков ядра exchange-core была изменена с 4ME+2RE на 2ME+1RE, что позволило увеличить среднюю пропускную способность на 185%, а производительность — на 133%.

Мультиагентные сценарии нужно сочетать с конкретными бизнес-процессами. Модель с открытым исходным кодом можно развернуть, преобразовать и подключить к внутренней цепочке инструментов предприятия — например, внедрить в IDE, CLI, автоматизированное тестирование, анализ данных и внутреннюю систему знаний предприятия. Организационная компетентность модели становится новым полем битвы: способность заставить несколько агентов работать сообща для выполнения сложных задач не менее важна, чем уровень интеллекта.