DeepDigest
TechOrange 科技報橘 · · ~4 мин

Goldman Sachs: потребление токенов ИИ вырастет в 24 раза к 2030 году

По прогнозам Goldman Sachs, потребление токенов ИИ вырастет в 24 раза к 2030 году. Компании ищут способы контролировать растущие расходы — используют подход FinOps, устанавливают лимиты, выбирают менее затратные модели. Некоторые стратегии включают перераспределение затрат между подразделениями и оптимизацию использования токенов в зависимости от задач.

LLM
Goldman Sachs: потребление токенов ИИ вырастет в 24 раза к 2030 году

По оценкам исследовательской группы Goldman Sachs, мировое потребление токенов в период с 2026 по 2030 год вырастет в 24 раза и достигнет 120 гигабайт (квадриллионов) токенов в месяц. При этом цена на модель, по данным Bain & Company, упала примерно на 50 % в период с декабря 2024 по декабрь 2025 года, но потребление токенов за тот же период выросло в 4,5 раза — и этот рост перевесил падение цены.

Причина роста потребления кроется в изменении моделей использования ИИ: чат‑боты, которые раньше работали на основе подсказок, заменяются автономными агентами ИИ, которые «всегда включены» и потребляют значительно больше токенов. Джим Шнайдер (Jim Schneider), старший аналитик по полупроводникам и ИТ‑сервисам в Goldman Sachs, отметил, что объём вычислений, необходимый для назначения агента для выполнения задачи, может быть в 50 раз больше, чем при задавании вопросов чат‑боту. Goldman Sachs также прогнозирует, что к 2040 году потребление токенов на корпоративной стороне увеличится в 55 раз.

Компании ищут способы контролировать расходы. Например, Anthropic перешёл на объёмную оплату, а GitHub в апреле скорректировал цены, перейдя на начисление баллов в зависимости от использования токенов. Есть и примеры перерасхода: по данным ITPro, одна неназванная компания случайно потратила 5,5 млрд долларов на Claude из‑за отсутствия лимита использования; Uber после исчерпания бюджета на ИИ в течение четырёх месяцев установил лимит для сотрудников на уровне 1,5 тыс. долларов в месяц.

По данным TechRadar, Gartner прогнозирует, что к 2028 году расходы на инструменты для кодирования ИИ могут превысить среднюю зарплату разработчика. Компании начали менять подход: например, Accenture попросил неинженеров сократить использование ИИ для тривиальных задач (вроде преобразования PDF‑файлов в презентации). Amazon и Meta убрали рейтинги, поощряющие сотрудников использовать ИИ, Microsoft закрыла доступ к Claude Code из‑за дороговизны, а Walmart ограничил использование внутренних агентов ИИ.

Некоторые компании применяют подход FinOps — он возник во время бума облачных технологий в 2010‑х годах для управления растущими расходами на облако, а теперь используется для контроля затрат на ИИ. Например, Priceline использует информационную панель для отслеживания использования токенов и ежемесячно отчитывается перед финансовым и техническим директорами. Если уровень использования сотрудником высок, с ним проводят диалог, чтобы уточнить, как он использует ИИ. Principal Financial Group создала механизм управления и оптимизации, основанный на прошлых практиках управления облаком. Компания Smartsheet использует команду FinOps: она устанавливает автоматические сигналы тревоги, напоминающие о приближении верхнего предела, и предоставляет панель мониторинга, которая разделена по отделам и руководителям — так затраты видны в реальном времени.

Есть и прямые способы снижения затрат. Например, Qualcomm устанавливает лимиты на токены для команд и внедряет механизм «возврата»: преобразует использование каждого отдела в фактическую сумму и распределяет её между ними. Шеннон Белл, директор по информационным технологиям и директор по цифровым технологиям OpenText, отмечает, что такой подход может снизить стоимость токенов организации на 20–30 %. Некоторые компании используют для задач более мелкие, старые или модели с открытым исходным кодом. Qualcomm, к примеру, запустила их на собственном оборудовании. Симантини Годбол (Seemantini Godbole), директор по цифровой информации ритейлера Lowe’s, рассказала, что компания внедрила модель меньшего размера с открытым исходным кодом — это помогает избежать «растраты токенов».

Брайан Армстронг, генеральный директор криптовалютной биржи Coinbase, озвучил пять стратегий снижения затрат:
1. Установить по умолчанию более дешёвую модель с открытым исходным кодом.
2. Перенаправлять запросы на наиболее подходящую модель в зависимости от сложности задачи — например, использовать передовые модели при планировании, но не во время выполнения рутинных операций.
3. Эффективно использовать кэш.
4. Открывать новый этап работы при переключении задач, чтобы упростить контекст.
5. Улучшить визуализацию затрат компании с помощью ИИ.

Армстронг подчеркнул: цель не в ограничении использования ИИ, а в создании инфраструктуры, которая позволит продолжить экспоненциальный рост. По его словам, использование токенов компанией достигло рекордно высокого уровня, но расходы на ИИ сократились почти вдвое по сравнению с пиком.

Рид из Priceline отмечает: высокий уровень использования сам по себе не имеет значения — важно, с какими бизнес‑результатами он связан. Нитиш Тяги (Nitish Tyagi), старший аналитик Gartner, указывает на то, что большинству организаций по‑прежнему не хватает системы для измерения взаимосвязи между затратами и влиянием на бизнес. Кроме того, поставщики недостаточно раскрывают информацию о расчёте токенов, что затрудняет компаниям оценку затрат и их оптимизацию.

// оригинал
TechOrange 科技報橘 ↗ Читать оригинал
1 просмотров
// поделиться Telegram VK