Забув обмеження: одна компанія за місяць витрачає 500 мільйонів доларів на Claude

robot
Генерація анотацій у процесі

Автор: Бао Йолонг; джерело: Wall Street Journal

Бум корпоративного штучного інтелекту стикається з першою справжньою кризою рахунків.

28 травня, за даними Axios, посилаючись на слова консультанта з AI, одна з компаній-клієнтів нещодавно витратила 500 мільйонів доларів за один місяць на Claude, причиною чого стала відсутність будь-яких обмежень для використання співробітниками.

Аналіз показує, що багато компаній, швидко впроваджуючи інструменти AI, зосереджуються на функціональності та просуванні, ігноруючи створення механізмів контролю витрат.

Технологічні гіганти, такі як Microsoft, Amazon, активно вживають заходів, скорочуючи внутрішні інструменти AI або припиняючи проекти з відстеження використання AI, щоб стримати надмірне споживання, яке називають "tokenmaxxing" (максимізація токенів).

Один з високопоставлених віце-президентів Amazon був змушений попередити співробітників:

Не використовуйте AI просто так.

Головна проблема, з якою зараз стикається ринок, вже не в тому, "чи варто впроваджувати AI", а в тому, "на що витрачається так багато грошей і що з цього отримано".

Amazon закриває рейтинг, внутрішнє "накручування балів" спричинило реальні витрати

Приклад Amazon з іншого боку ілюструє труднощі управління AI у компаніях.

За повідомленнями, посилаючись на двох інформованих джерел, платформа для розробників Amazon Kiro мала внутрішній рейтинг під назвою "Kirorank", який оцінював активність співробітників у використанні AI.

Однак цей рейтинг несподівано викликав поведінку співробітників, які намагалися підвищити свої позиції, виконуючи беззмістовні завдання через AI-агентів, що безпосередньо призвело до зростання споживання обчислювальних ресурсів компанії.

В цьому тижні віце-президент Amazon Дейв Трідвелл визнав, що цей рейтинг був задуманий добре, але в підсумку співробітники через "tokenmaxxing" підвищили операційні витрати компанії.

Він чітко наказав співробітникам не зосереджуватися на кількості витрачених токенів, а зосередитися на створенні кращих продуктів і наголосив: "Не використовуйте AI просто так".

У заяві Amazon підтвердили, що цей тестовий дашборд "не є офіційним або затвердженим інструментом і вже знятий з експлуатації".

Meta також стикнулася з подібною ситуацією: співробітники намагалися підвищити свої позиції у внутрішньому рейтингу, збільшуючи споживання токенів.

Ця ситуація свідчить, що коли компанії включають використання AI у систему оцінювання, це може мати зворотній ефект, викривляючи мотивацію співробітників у бік безглуздої витрати обчислювальних ресурсів.

Після цього Amazon перейшов до використання метрики "нормалізованого розгортання" замість кількості токенів, зосереджуючись на тому, чи здатні інженери постійно генерувати корисний код за допомогою AI.

Варто зазначити, що капітальні витрати Amazon цього року, за прогнозами, сягнуть 200 мільярдів доларів, більша частина яких спрямована на AI та інфраструктуру дата-центрів.

Чотири головні проблеми: чому витрати на AI не приносять очікуваного результату

За даними Axios, у корпоративному AI зараз існує чотири структурні перешкоди.

Некоректний вибір сценаріїв. Генеральний директор Velastegui Ventures, колишній головний AI-офіцер Microsoft Софія Веластегі, зазначає, що більшість людей прагнуть автоматизувати за допомогою AI ті роботи, які їм не подобаються, а не ті, що найбільше цінні для компанії.

Вона вважає, що компанії слід зосередитися на сценаріях, які безпосередньо сприяють зростанню доходів, а не на бездумному розгортанні.

Відсутність контролю витрат. Запити до AI не безкоштовні: корпоративні пакети оподатковуються за кількістю токенів, і навіть прості щоденні запити швидко накопичують значні витрати, але більшість бізнес-підрозділів цього не усвідомлює.

Люди — найбільший бар’єр. В Velastegui вважають, що поширена практика "роздачі" дозволів на AI без належного керівництва є шляхом, що не приносить реальної віддачі.

Компанії видають багато інструментів AI співробітникам, але без ефективного керівництва та фокусування це призводить до низької ефективності впровадження.

Обмеження у відкритті даних. Генеральний директор Boosted.ai, що спеціалізується на фінансових AI-інструментах, Джош Пантони, зазначає, що коли компанії через побоювання щодо безпеки даних не бажають відкривати внутрішні конфіденційні дані для AI-агентів, їхня ефективність значно знижується, і відповідно, повернення інвестицій стає неможливим.

Token-економіка: новий ключовий фактор у розповіді про AI

За цим стоїть більш складна інвестиційна логіка, яка перебудовується.

Wall Street Journal повідомляє, що за останніми даними керівника відділу Goldman Sachs One-Delta Річа Пріворотскі, ключовий фактор у торгівлі AI змістився з "технічної здійсненності" на "можливість витрат".

Згідно з даними DeepSeek, ціна токенів знизилася на 75%, а Xiaomi MiMo знизила ціну майже на 99%. Це може спричинити цінову війну, подібну до субсидійних.

Він зазначає, що інфраструктурні обмеження рано чи пізно знімуться, і ринок не повинен платити занадто високі премії за "проблеми, які скоро будуть вирішені".

Річ Пріворотскі також припускає, що дешевші токени можуть швидше замінити високовартісні послуги з логіки. Якщо попит зростає з затримкою, доходи хмарних сервісів, компаній, що створюють моделі, та інфраструктури AI можуть зазнати тимчасового тиску.

Він вважає, що раціоналізація витрат на токени може стати важливою темою для ради директорів уже у другому та третьому кварталах цього року, і її важливість не менша за саму історію зростання AI.

За даними індексу витрат на токени Bloomberg Silicon Data LLM, ціна токенів зросла приблизно на 65% з кінця лютого цього року, а ціни на американське програмне забезпечення AI за минулий рік зросли на 20-37%.

Ця тенденція зростання витрат змушує компанії переглянути свої стратегії закупівлі AI. Коли "отримати 90% результату за 10% вартості" стає все більш реальним, залежність від високовартісних моделей може зменшитися.

Генеральний директор Micro1, компанії, що займається тренуванням AI-моделей, Алі Ансарі, зазначає, що компанії проходять через "здорову коливання" від надмірного використання AI до раціонального.

Він вважає:

Зараз найбільш ефективною сферою AI є програмування.

Боротьба між оптимістами і песимістами: одна й та сама реальність — різні інтерпретації

Щодо повернення інвестицій у AI, одна й та сама інформація може вести до зовсім різних висновків залежно від аналізу.

Оптимістичний погляд вважає, що нинішня плутанина — це нормальні труднощі процесу трансформації.

За оцінкою Джима Шнайдера з Goldman Sachs на початку травня, до 2030 року агентські AI сприятимуть зростанню споживання токенів у 24 рази, а прибутковість великих хмарних сервісів і постачальників моделей зросте протягом найближчих 3-12 місяців.

Джон Вілсон з JPMorgan також виявив, що у 2026 році різко зросте кількість пакетів Python на PyPI, що не спостерігалося під час запуску ChatGPT у 2022 році, що свідчить про реальне підвищення продуктивності.

Песимістичний погляд викладає аналітик з напівпровідників Джим Ковелло у квітневому звіті.

Він зазначає, що майже вся вартість у ланцюжку AI спрямована на виробництво напівпровідників, що є безпрецедентним і нестійким. В той час як виробники чипів мають отримувати вигоду від клієнтів, ця хвиля процвітання відбувається за рахунок витрат у верхній частині ланцюжка.

Обидві історії відбуваються одночасно, і переможець ще не визначений. Єдине, що можна сказати напевно, — просте рівняння "зростання споживання токенів означає успіх AI-перетворення" вже зруйноване.

Від екстремального випадку витрат у 5 мільярдів доларів за місяць до зупинки внутрішніх рейтингів Amazon — інвестиції в AI проходять через більш суворий контроль за результатами. Скільки реальної цінності принесе наступний рахунок за AI — стане справжнім вироком цій великій ставці.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено