Мы создали уровень маршрутизации, чтобы сократить расходы на ИИ, но это привело к поломке продукта. Уровни маршрутизации для оптимизации затрат — это ловушка Парето: счёт сокращается, а продукт выходит из строя. Большинству команд требуется три месяца, чтобы заметить это.
В прошлом квартале команда, с которой я работал, сократила расходы на логический вывод с помощью искусственного интеллекта более чем наполовину. На это ушло восемь недель чистого проектирования — это была победа, к которой инженеры стремились весь год. Однако оптимизация оказалась неправильной. Три месяца спустя удовлетворённость клиентов снизилась, отток клиентов увеличился, а экономия средств оказалась связана с потерей качества. Мы не выиграли — просто перевели затраты в другое русло, которое не измеряли.
Я ожидаю, что в ближайшие шесть месяцев мы увидим такую же картину при внедрении ИИ на производстве. Обсуждение экономики ИИ в 2026 году привело к выработке единого подхода: перенаправлять простые запросы на дешёвые модели, а дорогостоящие — на эффективные. Цель — сократить расходы, сохранив качество. Каждый финансовый директор знаком с математикой, каждая команда инженеров разработала или продолжает разрабатывать соответствующие решения.
Математика реальна, и ловушка Парето тоже реальна. Ниже я привёл фрагмент, который рассказал команде после вскрытия проблемы. В нём описана созданная ими архитектура, режим сбоя, в который они попали, методология, которая могла бы выявить проблему раньше, а также архитектурный шаблон, который стоило использовать вместо имеющегося. Кроме того, речь идёт о двух других вариантах развёртывания, которые я использую в audio.