ИИ-стартап Sakana AI построил систему Sakana Fugu на платформе Gemini Enterprise Agent Platform от Google Cloud. Система объединяет несколько моделей ИИ для выполнения задач — есть два варианта: Fugu (с акцентом на скорость вывода) и Fugu Ultra (с высокой производительностью). По словам представителей компании, Fugu Ultra в ряде задач превосходит американские модели Claude Mythos Preview и Claude Fable 5.
Система состоит из трёх слоёв: интерфейсного, промежуточного уровня обработки и слоя модели. На интерфейсном уровне используются «Облачная броня Google» (функция сетевой безопасности) и «Модельная броня» (защита моделей и агентов ИИ) — они оберегают систему от неверного ввода данных и DDoS‑атак. Аутентификация и защита пользователей, управление ключами API и прочее реализованы через Firebase. Промежуточный уровень отвечает за вызов моделей, обработку журналов и кэшей, запись данных в BigQuery. Уровень модели генерирует ответы, комбинируя разные модели (в том числе от Google, OpenAI и Anthropic) в среде Cloud Run и на платформе Gemini Enterprise Agent Platform (ранее — Vertex AI).
Ци Сун, который отвечал за проектирование инфраструктуры в Sakana Fugu, отметил, что переход на Google Cloud был естественным шагом: компанию основали в основном инженеры из Google и Google DeepMind, а Google Cloud — это стабильная инфраструктура с управляемым сервисом для подключения нескольких моделей. Google Cloud Japan опубликовал тематическое исследование сотрудничества двух компаний 29 сентября.