 世界的なAI需要の爆発、計算資源の逼迫、ハードウェアコストの上昇により、大規模モデルのメーカーとクラウドサービス提供者が最近一斉に値上げを行った。 3月11日、テンセントクラウドが先行して料金体系を調整し、混元シリーズモデルのTencent HY2.0 Instructの入力価格を0.0008元/千トークンから0.004505元/千トークンに引き上げ、約463%の値上げとなった。同時に、GLM 5やMiniMaxなどのサードパーティモデルの無料公開テストを終了し、正式な商用運用に移行した。 3月16日、智谱は新モデルのGLM-5-Turboを発表し、API価格を20%引き上げた。これは前世代のGLM-4.7と比べて平均83%の値上げとなる。 3月18日、アリババクラウドと百度インテリジェントクラウドが同日に値上げを発表した。公式発表によると、アリババクラウドは平頭哥真武810Eなどの計算カード関連サービスやCPFS(知能計算版)などのサービス価格を調整し、最大34%の値上げとなる。一方、百度インテリジェントクラウドはAI計算能力関連の製品・サービスの価格を約5%~30%引き上げ、並列ファイルストレージなども約30%値上げした。両社とも値上げの理由を「世界的なAI需要の爆発」としている。 世界的なAIの総需要は推定しにくいが、世界最大のAPI統合プラットフォームであるOpenRouterの公開データから一端を窺うことができる。OpenRouterは複数の人工知能モデルを統合したAPIプラットフォームで、一般ユーザーや開発者は統一されたインターフェースを通じてGPT-4、Claude、Gemini、Deepseekなどの異なるLLMモデルを呼び出し、対話やチャットを行うことができる。 OpenRouterが公開したデータによると、2025年3月24日週にこのプラットフォームを通じて呼び出された大規模モデルのトークン使用量は1.62兆だったが、今年3月9日週にはその使用量が16.90兆に増加し、1年で10倍に膨れ上がった。特に、今年1月30日に正式リリースされたOpenClaw(「ロブスター」)の登場以降、トークン使用量の増加速度はさらに顕著だ。OpenClawリリース週のトークン使用量は8.25兆だったが、その後わずか1ヶ月余りで2倍の16.90兆に跳ね上がった。 銀河証券のレポートによると、2026年3月の第1週にはプラットフォームの処理量が14.8兆トークンに達し、年初の週と比べて倍増した。特に、エージェント駆動のワークフローによる出力トークンはプラットフォーム全体の半数を超えている。 また、3月9日週の具体的なトークン使用量を見ると、4つの国産大規模モデルがトップを占めている。MiniMax M2.5は1.75兆で第一位、Step 3.5 Flash(ステップ・星辰)とDeepSeek V3.2はそれぞれ1.34兆と1.04兆で第二・第三位、Kimi K2.5は0.56兆で第九位だ。さらに、2月9日週に中国のモデル呼び出し量が米国を超えた後、MiniMax M2.5は連続5週間第一位を維持している。 OpenRouterはプラットフォーム経由の呼び出しのみを集計しており、直接メーカーのAPIを利用しているユーザーは含まれていないが、その世界最大のAPI統合プラットフォームとして、これらのデータからも国産大規模モデルの実力と巨大な需要が窺える。(出典:東方財富研究中心)
トークンの使用量が1年で10倍に増加したため、メーカーが値上げをするのも納得です
世界的なAI需要の爆発、計算資源の逼迫、ハードウェアコストの上昇により、大規模モデルのメーカーとクラウドサービス提供者が最近一斉に値上げを行った。
3月11日、テンセントクラウドが先行して料金体系を調整し、混元シリーズモデルのTencent HY2.0 Instructの入力価格を0.0008元/千トークンから0.004505元/千トークンに引き上げ、約463%の値上げとなった。同時に、GLM 5やMiniMaxなどのサードパーティモデルの無料公開テストを終了し、正式な商用運用に移行した。
3月16日、智谱は新モデルのGLM-5-Turboを発表し、API価格を20%引き上げた。これは前世代のGLM-4.7と比べて平均83%の値上げとなる。
3月18日、アリババクラウドと百度インテリジェントクラウドが同日に値上げを発表した。公式発表によると、アリババクラウドは平頭哥真武810Eなどの計算カード関連サービスやCPFS(知能計算版)などのサービス価格を調整し、最大34%の値上げとなる。一方、百度インテリジェントクラウドはAI計算能力関連の製品・サービスの価格を約5%~30%引き上げ、並列ファイルストレージなども約30%値上げした。両社とも値上げの理由を「世界的なAI需要の爆発」としている。
世界的なAIの総需要は推定しにくいが、世界最大のAPI統合プラットフォームであるOpenRouterの公開データから一端を窺うことができる。OpenRouterは複数の人工知能モデルを統合したAPIプラットフォームで、一般ユーザーや開発者は統一されたインターフェースを通じてGPT-4、Claude、Gemini、Deepseekなどの異なるLLMモデルを呼び出し、対話やチャットを行うことができる。
OpenRouterが公開したデータによると、2025年3月24日週にこのプラットフォームを通じて呼び出された大規模モデルのトークン使用量は1.62兆だったが、今年3月9日週にはその使用量が16.90兆に増加し、1年で10倍に膨れ上がった。特に、今年1月30日に正式リリースされたOpenClaw(「ロブスター」)の登場以降、トークン使用量の増加速度はさらに顕著だ。OpenClawリリース週のトークン使用量は8.25兆だったが、その後わずか1ヶ月余りで2倍の16.90兆に跳ね上がった。
銀河証券のレポートによると、2026年3月の第1週にはプラットフォームの処理量が14.8兆トークンに達し、年初の週と比べて倍増した。特に、エージェント駆動のワークフローによる出力トークンはプラットフォーム全体の半数を超えている。
また、3月9日週の具体的なトークン使用量を見ると、4つの国産大規模モデルがトップを占めている。MiniMax M2.5は1.75兆で第一位、Step 3.5 Flash(ステップ・星辰)とDeepSeek V3.2はそれぞれ1.34兆と1.04兆で第二・第三位、Kimi K2.5は0.56兆で第九位だ。さらに、2月9日週に中国のモデル呼び出し量が米国を超えた後、MiniMax M2.5は連続5週間第一位を維持している。
OpenRouterはプラットフォーム経由の呼び出しのみを集計しており、直接メーカーのAPIを利用しているユーザーは含まれていないが、その世界最大のAPI統合プラットフォームとして、これらのデータからも国産大規模モデルの実力と巨大な需要が窺える。
(出典:東方財富研究中心)