価格が83%上昇した後、トークンが売り切れに。智谱の決算には業界の転換点が隠されている

2026-04-08 04:57:45

2026年2月の第3週、世界最大のAIモデルAPIアグリゲーション・プラットフォームであるOpenRouterで、歴史的なデータが現れた。中国の大規模言語モデル（LLM）の週間Token呼び出し量が5.16兆にまで上昇し、同時期の米国モデルの2.7兆を初めて上回った。世界の呼び出し量ランキング上位5モデルのうち、中国が4枠を占める。

1年前、このプラットフォームの構図はまったく別の物語だった。AnthropicだけでTokenシェアの42%を独占し、中国のモデルはほとんどテーブルにいなかった。

この逆転が起きたのと同じ週に、智谱がGLM-5を発表すると同時にAPIの値上げを83%すると告知した。価格競争が業界の主旋律である中で、これは国産LLMが最初に切った値上げカード——しかも値上げ後も、市場は依然として智谱に対して支払いを続けた。

3月31日、智谱（02513.HK）が上場後初の年次業績報告書を公表した。2025年通期の収入は7.24億元（人民元）で、前年同期比131.9%増。国内で収入規模最大の独立系大規模言語モデル会社としての地位を継続している。智谱CEOの張鵬は業績発表会で、同社の成長ロジックを一言でこうまとめた。「モデルが十分に強ければ、APIそのものが最良のビジネスモデルだ。」さらにこう判断している。「知能の質が価格決定権を生み、企業とユーザーの深い利用が成長のScalingを生み出す。」

この決算の核心的な見どころは、特定の収入数字ではなく、Anthropicのような商業モデルと成長が智谱の上で起きていることにある。国内の大規模言語モデル業界における、座標系レベルの参照点を提供している。

中国の大規模言語モデルの商業化における転換点

2024年後半から2025年初にかけて、中国の大規模言語モデル業界は苛烈な価格戦を戦った。

ByteDanceのDoubaoが推論入力の価格を0.0008元/千tokensまで引き下げ、AlibabaのTongyi QianwenはGPT-4級の主力モデルを97%値下げした。智谱自身も以前、GLM-4-Plusを90%値下げすると発表していた。あの段階では、ほぼすべてのプレイヤーが同じことをやっていた。補助金でエコシステムを作り、低価格で呼び出し量を獲得する。供給過剰の中で、ユーザーを奪うことこそが最優先の仕事だった。

価格戦は確かに、その歴史的使命を完了した。Tokenが十分に安くなった後、個人開発者や企業の利用習慣が育ち、呼び出し量のベースが構築されていった。

しかし価格戦の終着点は、誰がより安いかではなく、誰が先に「高いが価値がある」と顧客に感じさせるかだ。

2026年2月12日、転機が到来した。GLM-5の発表当日に、智谱はCoding Planの価格体系について構造的な調整を行うと同時に、全体の上昇幅は30%からという方針を打ち出した。2026年の第1四半期、智谱のAPI値上げ幅は最大で83%に達した。市場の反応は流出ではなく、買いあさり——品切れ、販売制限、謝罪、一連の流れだった。

なぜ値上げすると売り切れるのか？

Codingはチャットではなく、実在する生産力のシーンである。GLM-5はSWE-bench Verifiedなどの中核的なプログラミングランキングでオープンソース1位を堅持し、極めて少ない人手介入でバックエンドのリライト、深いデバッグなどのシステム工学タスクを自律的に完了できる。開発者がこのような「エンジニア」に対して払うのは、チャットボットに払うのとは完全に異なる意思決定だ。149元/月のProパッケージは、プログラマーにとって支出ではなく投資であり、節約した時間はそのまま成約・納品の効率に換算される。

張鵬は業績発表会で、率直にこう語った。「開発者は、知能の上限（perceived upper bound）を感じ取るうえで最も敏感な集団だ。」智谱は国内で初めて、プログラミング・パッケージであるGLM Coding Planを2025年に提供し、有料の開発者規模は急速に24.2万人を突破。Token呼び出し量は6か月で15倍に増えた。

収入構造の観点から見ると、この決算報告書は、従来の市場の印象とはまったく異なる一枚の絵を示している。API呼び出しが爆発的に伸びている一方で、プライベート化による収入の比率が大幅に縮小しているのだ。いまやAPIの継続的収入が智谱の業績の主力エンジンになっており、成長は契約獲得による駆動ではなく、利用量そのものが伸びている。

当モデルが単なる雑談相手のツールにとどまるとき、**価格はコスト変数である。モデルが完全なシステムを引き渡せるとき、価格は生産力変数である。**前者の天井はユーザーの忍耐であり、後者の天井はユーザーが節約できる人件費である。

この変化は、智谱に対する市場の値付けを直接書き換えた。プロジェクト型の会社はPEで見られ、プラットフォーム型の会社はARRで見られる——2つのまったく異なる評価ロジックだ。今日、市場では智谱はもはやプロジェクトごとに料金を取っているのではなく、呼び出し量に応じてレンタル料（課金）を取るようになっていると見られている。前者は労働集約型ビジネスで、後者はプラットフォーム・エコノミーだ。

張鵬は、価格決定権のロジックをひとつの式にまとめた。『AGI時代の商業価値＝知能の上限 × Token消費規模』。「知能の上限が価格決定権を決め、Token消費規模が価値のボリュームを決める。」さらにこう判断している。「モデルが十分に強ければ、API自体が最良の商業モデルになる。知能の質が価格決定権を生み、企業とユーザーの深い利用が成長のScalingを生む。」

83%値上げ後、呼び出し量が下がらずむしろ上がった。まさにこの判断の第1回の実戦検証だった。Anthropicも大洋彼岸で同じ道を歩んでいる——2025年末のARRは90億ドル、Claude Codeは単品で9か月に25億ドルを達成した。

プログラミングがコード断片を書く段階から、完成したシステム工学へ格上げされると、Token消費量と単価は同時に上がることができる。智谱は現在、この道筋を中国で再現している。

「中国版Anthropic」が爆発期に入る

智谱のこの決算報告書の重みをさらに理解するには、まず大洋彼岸からの数字の束を見ておく必要がある。

Anthropicは15か月で前例のない成長を成し遂げた。ARRは2024年末の10億ドルから、2026年3月の190億ドルへと伸びた。ユーザー数はChatGPTの5%にすぎないのに、収入はOpenAIの40%以上を実現している。1ユーザー当たりのマネタイズ効率は後者の8倍だ。Anthropicの収入の約80%は企業向けのAPI呼び出しサービスから来ており、Fortune 100のうち70%がClaudeの顧客だ。

Anthropicの教訓は、その規模がどれほど大きいかではない。ユーザー数はスケール指標であり、呼び出しの深さが真のお金に変わり得ることを証明した点にある。

張鵬は業績発表会で、智谱をこの座標系の中に明確に位置づけた。同社は「中国版のAnthropicという商業ルートに沿っていく。モデルの知能を土台にし、APIプラットフォームをエンジンにする」と率直に述べている。

データがその判断を裏づけている。智谱の2025年通期収入は7.24億元で、前年比131.9%増。会社が年初に設定した目標を上回った。通期の総合粗利益率は41%で、業界水準を大きく上回る。MaaS APIプラットフォームのARRは約17億元で、過去12か月で60倍に伸びた。MaaSプラットフォームの粗利益率は、近5倍に改善して18.9%になった。

しかし財務数値以上に、フライホイールが回転している状態を示しているのは、「統合されている」密度だ。

中国の上位10のインターネット企業のうち、すでに9社が毎日GLMモデルを深く呼び出している。GLMは世代モデルが発表されてから24時間以内に、ByteDanceのTRAE/Coze、AlibabaのQoder、TencentのCodeBuddy、MeituanのCatPaw、Kuaishouの万擎、BaiduのBaidu Intelligent Cloud、WPS Officeなどの主要プラットフォーム製品に公式接続される。

ロングテールを見れば、400万社以上の企業ユーザーおよび開発者が実際の生産環境で継続的に呼び出しており、世界の218以上の国・地域に広がっている。GLMはWindsurf、OpenCodeなどの国際的なCodingプラットフォームのデフォルトモデルになっており、OpenRouterの有料モデルランキングでは1位だ。

統合されている密度は、代替不可能性の密度である。

フライホイールが回り始める起点は、モデルの効果だ。GLMシリーズは引き続き、世界のオープンソースモデル1位、中国のモデル1位を維持し、GPT、Claude、Geminiを含む世界の全モデルの中で、グローバルAIの第一梯隊に安定して入っている。

GLM-5の登場の仕方自体が、一つのポジショニング宣言になっている。「Pony Alpha」という匿名の身でOpenRouterのホットランキング1位に登場し、シリコンバレーの開発者たちはそれがClaude Sonnet 5またはDeepSeek-V4だと次々に推測した。正体が明らかになった後、初日から40億Token、20.6万リクエストを処理した。

粗利益率の改善もまた、フライホイール効率の向上を裏づけている。ソフト・ハード協調のco-designと推論側で、動的なスパース注意力（dynamic sparse attention）により、デプロイコストを従来の50%まで下げつつ、性能は無損失に保った。顧客側では、値上げが正の選別効果をもたらし、効果に対して支払う意思のある顧客は、むしろ解約率や呼び出しの深さが高い。

張鵬はこの正の循環をこう描写している。「知能の上限の突破がToken消費量の指数級の増加を押し上げる——モデルが強くなり、利用シーンがより深くなるほど、Tokenの呼び出し量は大きくなる。」「商業上の正のフィードバックが、より大きな計算資源と研究開発への投資を支え、それにより知能の上限もさらに引き上げられる。このフライホイールはすでに回り始めている。」

Token経済学の次の爆発点

2月26日、NVIDIAのCEOである黄仁勋は決算電話会議で、市場に向けて判断を繰り返し強調した。「計算は収入であり、推論も収入だ。」計算能力がなければTokenは生成できない。Tokenがなければ収入成長につながらない。

世界のデータがこの見方を裏づけている。過去1年間、OpenRouterの上位10モデルの週次Token呼び出し量は、1.24兆から14兆近くへと急増し、増幅は10倍超。不正確なのはユーザーの増加だけではなく、単一ユーザーあたりのToken消費の深さも上がっている。Agentは1つのタスクを完了するたびに、より多段の手順や多様なツール呼び出しが必要で、Token消費は手順ごとに積み上がっていく。

インターネットの時代では無料が王道だった。流量の限界コストがゼロに近づくからだ。AI時代はまったく違う。 毎回の推論が計算資源を燃やすため、Tokenは自然に価格を持つ。 これは、AI企業が初日から「従量課金」という商業モデルに座っていることを意味する。

張鵬は判断のフレームワークを提示した。2025年の智谱のキーワードは「知能の上限」で、2026年のキーワードは「Token量」だ。「OpenClawを代表とするアプリがToken消費の狂騒を引き起こす。私たちは引き続き投資を強化し、推論性能を限界まで搾り出す。短期的な収益のためではなく、ずっと上向きの、良質なToken消費の指数カーブを支えるためだ。」

智谱は過去1年間に5世代のモデルを反復してきたが、語っているのはToken消費量がどのように持続的に増幅される物語かということだ。

張鵬はこのパラダイムの道筋を分解した。AI codingの段階では、モデルはコードを書くことを学ぶが本質的には補助者である。Vibe codingの段階では、Codeは安いが、Ideaこそが価値だ。Agentic engineeringの段階では、AIがエンジニアのように自律的に要求を理解し、計画を立て、作成し、テストし、さらに反復して修復する。long horizonの段階に至ると、AIは熟練の専門家のように、より長い時間スケールで継続して仕事をし、成果物を納品する必要がある。

それぞれのジャンプのたびに、単一タスクのToken消費は前段階の倍数級で増幅される。報道によれば、近日正式にリリースされる****GLM-5.1はlong horizon task向けの体系的な最適化が行われ、狙いはまさに次の段階だ。

OpenClawの爆発が、このトレンドを理論から現実に変えた。2026年3月、智谱はClaw Planをリリースした。リリース後2日でサブスクユーザーが10万人を突破し、20日で40万人を突破した。AI Agentは7×24時間自律稼働し、各インスタンスがTokenを継続的に燃焼させる「デジタル社員」だ。

需要が爆発している。供給側がつまずくわけにはいかない。GLM-5はすでに、華為の昇腾、モールスレッド（Moore Threads）、寒武紀（Cambricon）など、国内の7つの国産チッププラットフォームとの深い推論適応を完了している。張鵬は、GLMシリーズが国産チップ上で国際トップクラスの推論効率に肩を並べる成果を出していると言う。計算資源は自社で自主的に制御でき、Tokenの生産能力がボトルネックで詰まることはない。

智谱はこの一連のロジックを、ひとつの概念に圧縮した。TAC（Token Architecture Capability）、Tokenアーキテクチャ力。TAC ＝知能的な呼び出し量 × 知能的な品質 × 経済的転化効率。

張鵬は、将来価値を測る基準は、どれだけ多くの情報を掌握しているかではなく、Tokenアーキテクトとして大規模モデルとAgentを駆動して複雑タスクを完了させる能力になると考えている。「智谱の目標は、社会全体のTACを高める基盤インフラになることだ。そうすれば、あらゆる1滴のTokenが、納品可能な経済的増分へと転化できる。」

Anthropicは同じロジックで、3800億ドルのバリュエーションと190億ドルのARRを獲得した。中国のMaaSモデルの天井がどこにあるのか——この決算報告書は最初の正式な座標点だ。

大規模言語モデル業界では、**「供給が不足している」**というこの4語は、いかなる決算数値よりも説得力がある。 ある企業が「品切れ」になったことを謝罪し始めた時点で、価格決定権をめぐるあらゆる議論は終わりを迎えられる。

*上記の内容は投資助言を構成するものではなく、掲載プラットフォームの見解を代表するものでもない。市場にはリスクがあるため、投資には慎重を期し、自ら判断し決定してください。*

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。