Использование токенов увеличилось в 10 раз за год. Неудивительно, что производители повышают цены

robot
Генерация тезисов в процессе

Под воздействием взрывного роста мирового спроса на ИИ, нехватки вычислительных ресурсов и повышения стоимости аппаратного обеспечения, крупные разработчики моделей и облачные провайдеры в последнее время массово повышают цены.

11 марта Tencent Cloud первой скорректировала ценовую политику: цена за входные данные серии моделей混元 (Hunyuan) Tencent HY2.0 Instruct выросла с 0,0008 юаня за тысячу токенов до 0,004505 юаня, что составляет рост на 463%; одновременно завершена бесплатная публичная тестировка сторонних моделей GLM 5, MiniMax и других, и они перешли в стадию коммерческого использования.

16 марта Zhipu выпустила новую модель GLM-5-Turbo и повысила цену API на 20%, что в среднем на 83% превышает предыдущий уровень GLM-4.7.

18 марта одновременно объявили о повышении цен Alibaba Cloud и Baidu Smart Cloud. Согласно официальным заявлениям, Alibaba Cloud скорректирует цены на услуги, связанные с вычислительными картами, такими как PingTouGe ZhenWu 810E, а также на услуги CPFS (интеллектуальная версия), с максимальным ростом до 34%; Baidu Smart Cloud ясно указала, что цены на продукты и услуги, связанные с ИИ-вычислительными мощностями, увеличатся примерно на 5–30%, а цены на параллельное файловое хранилище — примерно на 30%. Обе компании объяснили повышение цен «взрывным ростом глобального спроса на ИИ».

Хотя общие показатели мирового спроса на ИИ трудно точно оценить, можно получить представление по данным крупнейшей в мире платформы агрегирования API — OpenRouter. Как сообщается, OpenRouter — это платформа API, объединяющая модели искусственного интеллекта от нескольких компаний, и обычные пользователи и разработчики могут через единый интерфейс вызывать различные LLM-модели для диалогов, такие как GPT-4, Claude, Gemini, Deepseek и другие.

Данные, опубликованные OpenRouter, показывают, что за неделю, заканчивающуюся 24 марта 2025 года, объем токенов, использованных для вызова крупных моделей через платформу, составил 1,62 триллиона, а к 9 марта этого года эта цифра выросла до 16,90 триллионов — в 10 раз за год. Особенно заметен рост после официального запуска OpenClaw («Лобстер») 30 января этого года: за первую неделю его использования платформа использовала 8,25 триллионов токенов, а всего за чуть более месяца эта цифра удвоилась до 16,90 триллионов.

Исследовательский отчет Galaxy Securities отмечает, что в первую неделю марта 2026 года объем обработки платформы достиг 14,8 триллионов токенов, что вдвое больше по сравнению с началом года, при этом более половины токенов генерируется рабочими потоками, управляемыми агентами.

Кроме того, по данным конкретного использования токенов за неделю, начиная с 9 марта, лидируют четыре отечественные крупные модели. MiniMax M2.5 занимает первое место с 1,75 триллиона, Step 3.5 Flash (阶跃星辰) и DeepSeek V3.2 — с 1,34 и 1,04 триллиона соответственно, а Kimi K2.5 — на девятом месте с 0,56 триллиона. Более того, с момента, когда в неделю, начинающуюся 9 февраля, вызовы китайских моделей впервые превзошли американские, MiniMax M2.5 удерживает первое место уже пять недель подряд.

Хотя OpenRouter учитывает только вызовы через свою платформу и не включает пользователей, использующих напрямую API производителей, учитывая его статус крупнейшей в мире платформы агрегирования API, эти данные ясно демонстрируют силу и огромный спрос на отечественные крупные модели.

(Источник: Центр исследований Восточно-Финансовой Фондовой компании)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить