Використання токенів за рік зросло в 10 разів — невдивина, що виробники підвищують ціни

robot
Генерація анотацій у процесі

Через вибуховий зростання глобального попиту на ШІ, напруженість у ресурсах обчислювальної потужності та зростання вартості апаратного забезпечення, виробники великих моделей та постачальники хмарних сервісів нещодавно масово підвищили ціни.

11 березня Tencent Cloud першими скоригували цінову політику: ціна на вхідні дані для моделі серії 混元 Tencent HY2.0 Instruct зросла з 0,0008 юаня за тисячу токенів до 0,004505 юаня, що становить зростання на 463%; одночасно було припинено безкоштовне публічне тестування сторонніх моделей, таких як GLM 5, MiniMax, і перетворено їх у комерційне використання.

16 березня компанія 智谱 представила нову модель GLM-5-Turbo та підвищила ціну на API на 20%, що в середньому становить 83% зростання порівняно з попередньою моделлю GLM-4.7.

18 березня Alibaba Cloud та Baidu Smart Cloud у той самий день оголосили про підвищення цін. За офіційними повідомленнями, Alibaba Cloud оновить ціни на послуги, пов’язані з обчислювальними картами, такими як 平頭哥真武810E, та на послуги CPFS (інтелектуальна обчислювальна версія), з підвищенням до 34%; Baidu Smart Cloud чітко зазначила, що ціни на послуги, пов’язані з AI-обчислювальною потужністю, зростуть приблизно на 5%—30%, а ціни на паралельне файлове зберігання — приблизно на 30%. Обидві компанії пояснили підвищення цін «вибуховим зростанням глобального попиту на ШІ».

Хоча загальний попит на ШІ у світі важко точно оцінити, з даних найбільшої у світі платформи агрегування API OpenRouter можна зробити певні висновки. За інформацією, OpenRouter — це платформа, яка агрегує API кількох моделей штучного інтелекту, і звичайні користувачі та розробники можуть через єдиний інтерфейс викликати різні LLM-моделі для ведення діалогів, наприклад GPT-4, Claude, Gemini, Deepseek тощо.

Дані, оприлюднені OpenRouter, показують, що у тиждень, що закінчився 24 березня 2025 року, через цю платформу було використано 1,62 трильйона токенів для викликів великих моделей, а вже у цей рік, у тиждень, що закінчився 9 березня, ця кількість зросла до 16,90 трильйонів, що у 10 разів більше за рік. Особливої уваги заслуговує запуск OpenClaw («Лобстер») 30 січня цього року, після чого швидкість використання токенів стала ще більшою. У тиждень його запуску платформа використала 8,25 трильйонів токенів, а за менше ніж місяць ця кількість подвоїлася до 16,90 трильйонів.

Звіт аналітичної компанії 银河证券 зазначає, що у перший тиждень березня 2026 року платформа обробила 14,8 трильйонів токенів, що у два рази більше, ніж на початку року, причому понад половину вихідних токенів припадає на робочі процеси, ініційовані агентами.

Крім того, за даними конкретного тижня 9 березня, у лідерах опинилися чотири вітчизняні великі моделі. MiniMax M2.5 з показником 1,75 трильйонів токенів посів перше місце, Step 3.5 Flash (阶跃星辰) та DeepSeek V3.2 — друге і третє з 1,34 та 1,04 трильйонів відповідно, а Kimi K2.5 — дев’яте з 0,56 трильйонів. З початку лютого цього року, коли кількість викликів китайських моделей вперше перевищила американські, MiniMax M2.5 посідає перше місце вже п’ять тижнів поспіль.

Хоча OpenRouter рахує лише виклики, зроблені через платформу, і не враховує користувачів, які безпосередньо використовують API виробників, враховуючи його статус найбільшої у світі платформи агрегування API, ці дані все ж демонструють силу та величезний попит на вітчизняні великі моделі.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити