Токени стають золотом: Як AI-індустрія бореться з космічними витратами
Ключові деталі:
- Компанії стикаються з несподівано високими витратами на штучний інтелект, перевищуючи бюджетні плани через зростання споживання токенів.
- З’являється новий ринок інструментів та стандартів для відстеження, оптимізації та контролю витрат на ШІ.
- Створюється фундамент для стандартизації “токеноміки” для впровадження фінансової дисципліни у сфері ШІ-витрат.

Галузеві гравці все частіше зіштовхуються з непередбачуваною вартістю впровадження ШІ. Uber, наприклад, вичерпав увесь свій бюджет на розробку ШІ-коду на 2026 рік уже в квітні. Microsoft відкликала ліцензії Claude Code для своїх розробників через кілька місяців після їх надання. Один зі співробітників Priceline зазначив, що звичайне поновлення контракту з Cursor обійшлося в 4-5 разів дорожче.
Попри зниження вартості окремих токенів, агресивне впровадження ШІ та розвиток автономних агентів призвели до експоненційного зростання споживання. Компанії, які в першій половині 2025 року активно експериментували з необмеженими підписками, тепер змушені терміново розбиратися, куди йдуть їхні кошти, скорочувати витрати та шукати шляхи відшкодування інвестицій.
Паралельно формується ринок, що пропонує рішення для цієї проблеми. Стартапи, відомі постачальники та нова організація зі стандартизації спільно працюють над наданням компаніям інструментів і мови для детального моніторингу витрат.
«Шість місяців тому під час розмови з клієнтом ми обговорювали: «Що це може робити? Чи достатньо добре?» — розповів Олександр Ембірікос, керівник відділу корпоративних рішень OpenAI. «Зараз ці теми вже не актуальні. Розмови зосереджені на: «Ми витрачаємо надто багато. Яку видимість ви маєте? Чи є аудит? Які контролі токенів? Яка ефективність ваших моделей?»
Саме на тлі цих викликів Linux Foundation анонсувала створення Tokenomics Foundation — нової організації зі стандартизації, мета якої – запровадити таку ж фінансову дисципліну щодо токенів ШІ, яку FinOps забезпечив для хмарних витрат.
«У квітні-травні я чув від компаній: «Боже мій, ми перевищили наш бюджет на токени на 2026 рік утричі, а на календарі лише квітень», — поділився Дж. Р. Стормент, виконавчий директор FinOps Foundation. «Ми чули про екзистенційні кризи, і розмова змінилася з «максимізації токенів» та «руху вперед» на «нам потрібні захисні механізми, як це контролювати?»
Ці звернення лунали на тлі шаленого попиту з боку керівників, які вимагали від команд використовувати найкращі моделі та діяти швидко, незважаючи на витрати. Нові моделі, випущені в листопаді, такі як Claude Opus 4.5 від Anthropic, GPT-5.1 від OpenAI та Gemini 3 Pro від Google, значно покращили функціональність агентських інструментів, що призвело до багаторазового зростання споживання. Відомо про випадок, коли одна компанія отримала рахунок на 500 мільйонів доларів за використання Claude через те, що забула встановити ліміти використання для співробітників.
«Це схоже на епідемію креку», — зазначив Кріс Рід, старший директор з IT-фінансів у Priceline, додавши, що компанія вже почала встановлювати ліміти на використання токенів для певних груп. «Вони дозволяють спробувати, щоб ви «підсіли», а потім ви стаєте від них залежними».
Віталій Гордон, генеральний директор Faros AI, розповів про розмову з технічним директором, який повідомив: «Один з моїх інженерів витратив минулого місяця 40 000 доларів на токени, і я щиро не знаю, чи варто мені його зупиняти, чи сказати всім іншим наслідувати його приклад».
Дворічне дослідження 20 000 розробників, опубліковане Faros у квітні, показало, що продуктивність зростає, але водночас збільшується кількість помилок і необхідність переробок. Jellyfish, платформа для управління розробкою, виявила, що інженери, які найактивніше використовували ШІ, були приблизно вдвічі продуктивнішими за тих, хто використовував його менше, але при цьому витрачали в 10 разів більше токенів.
Ніколас Арколано, керівник відділу досліджень Jellyfish, пояснив, що витрати на ШІ стрімко зростають переважно через функціональність агентів, де споживання токенів на одного розробника збільшилося приблизно в 18,6 раза за дев’ять місяців. Ці показники роблять аргумент щодо підвищення продуктивності менш очевидним, ніж вказують витрати.
«Чи виправдовує надмірне витрачання коштів себе, залежить від кінцевої бізнес-цінності випущеного коду (наприклад, доходу), яку більшість компаній досі не можуть виміряти», — зазначив Арколано.
Принаймні частково ця проблема вимірювання пов’язана з масштабами використання ШІ сьогодні.
«Відстеження хмарних витрат — це проблема даних з сотнями мільйонів рядків на місяць», — пояснив Стормент. «Відстеження витрат на токени — це проблема з трильйонами рядків на місяць. Ви не можете просто завантажити це в електронну таблицю чи навіть простий інструмент. Вам доведеться кардинально переосмислити свої інструменти, специфікації та облікові системи».
У Priceline Рід вже спостерігає розбіжності. Він відзначив невідповідності між даними постачальника та внутрішньою інформацією компанії.
«Я починав свою кар’єру з управління витратами на телекомунікації, і бачу ті ж паралелі: від телекомунікацій до хмарних технологій і ШІ», — сказав він. «Будь-коли, коли ви впроваджуєте щось нове, це створює можливості для помилок у білінгу, аудиту та оптимізації».
Навколо цієї проблеми починає формуватися ринок. Існують компанії, як-от Pay-i, що відстежує, вимірює та оптимізує витрати та продуктивність інвестицій у GenAI. Paid, своєю чергою, дозволяє розробникам відстежувати витрати, вимірювати використання та виставляти рахунки користувачам на основі фактичної цінності, а не фіксованих підписок.
Також є компанії, як-от Jellyfish, Waydev та Faros AI, які надають моніторинг агентів ШІ для підтвердження рентабельності інвестицій у інструменти розробників. За словами Стормента, більшість із 180 постачальників у FinOps Foundation рухаються в цьому напрямку.
Компанії з наявною дистрибуцією також додають нові функції, щоб скористатися перевагами цього нового ринку. Ramp нещодавно вийшла на ринок управління витратами на ШІ; Datadog та New Relic додали послуги, такі як управління витратами на хмару, спостереження на рівні токенів та моніторинг GPU. На конференції FinOps X наступного тижня AWS, як очікується, представить нові функції фінансового менеджменту, спрямовані на корпоративні витрати на ШІ.
Тіффані Лак, партнер NEA, вважає, що ефективність токенів та спостережуваність, ймовірно, будуть інтегровані на «рівні інфраструктури або додатків». Вона вказала на Factory, стартап, що створює ШІ-агентів для підприємств, який минулого тижня запустив маршрутизатор моделей, що автоматично обирає найкращу модель для кожного завдання.
Гордон очікує, що передові лабораторії та інші постачальники моделей впровадять оптимізацію на кшталт OpenRouter для спрямування запитів до найдешевших моделей — тенденція, яка вже спостерігається у корпоративних рахунках за Claude.
«У фінансовому звіті про ваші витрати на Anthropic, навіть якщо ви використовуєте модель Opus, частина витрат припадатиме на Sonnet або Haiku, оскільки вони достатньо розумні, щоб це зробити», — зазначив Гордон. «Я думаю, це стане все більш поширеним явищем».
Однак усі ці інструменти розробляються без спільної мови чи узгоджених визначень щодо вартості токена, його результатів та можливості порівняння витрат між постачальниками. Саме тут Tokenomics Foundation сподівається стати корисною.
Фонд розробляє канонічні визначення та структуру для «токеноміки»; відкриті стандарти, специфікації та метрики для використання та білінгу токенів ШІ; а також нові метрики для економіки ШІ, як-от вартість за одиницю інтелекту або токени на ват. Він також планує визначити метрики ефективності фабрик токенів та споживання. Група планує офіційний запуск у липні та незабаром оголосить про нових членів на конференції FinOps X.
«Економіка токенів є фундаментально більш абстрактною та непрозорою, ніж будь-що, чим ми керували в такому масштабі раніше», — зазначив Нішант Гупта, директор з доступності Salesforce. «Це вимагає іншого операційного підходу, ніж той, що галузь побудувала для хмарних технологій».
Водночас Goldman Sachs прогнозує, що глобальне використання токенів зросте в 24 рази до 2030 року. Компанії, які вже перевищили бюджет, потребують рішень негайно, а перший результат роботи фонду буде доступний лише за кілька місяців.
«Можливо, ми створили парову машину, але ще не налагодили конвеєр», — підсумував Гордон.
За словами Арколано, найрозумнішим кроком є широке, помірне впровадження.
«Найкраща рентабельність інвестицій досягається за рахунок переведення широкого середнього сегменту користувачів з низького на помірний рівень використання, а не шляхом стимулювання інтенсивних користувачів до ще більшого споживання», — рекомендує він.
Джерело новини: techcrunch.com
