暴涨31.8%背后、智谱はAPI販売の件が成功したのか?

文/アーチー

昨日、智谱は2025年の通年業績を公表し、上場後初の決算報告書でもあります。

通年の売上は7.24億元で前年同期比131.9%増でした。ですが、31.8億元の研究開発投資が押し上げた結果、調整後の純損失は31.82億元に達しました。

これだけ大きく損失を出しているにもかかわらず、市場の反応は非常に前向きです。今日は、智谱の株価が31.8%上昇しました。

その重要な理由の一つは、APIを売る件が、うまく回り始めたように見えることです。

2025年、APIの売上は2024年の0.48億元から1.9億元へ増加し、前年同期比296%増となりました。同時に、智谱の経営陣は電話会議で、現在のAPIサービスARRは約2.5億ドルで、年末までに10億ドルに到達する見込みだと明確に述べています。

さらに重要なのは、これは孤立した事例ではないことです。他の大規模モデル企業でも、同様のトレンドが次第に見えてきています。Tokenの呼び出し量が増加し、APIが、最も直接的な収益化ルートの一つになりつつあるのです。

では、この現象はどう見ればよいのでしょうか。今日は智谱の決算と合わせてお話しします。

/ 01 /

基盤モデルの成長は、API販売で支える

この智谱の決算報告書で最も注目すべき変化は、収益構造の移行です。

クラウドへのデプロイが、最も中核的な成長源になっています。いわゆるクラウドへのデプロイとは、本質的にはAPIサービスです。2025年、この部分の収入は2024年の0.48億元から1.9億元へ増加し、前年同期比296%増でした。収益構成比も15.5%から26.3%へ引き上がっています。

APIの成長の中核ロジックは、呼び出し量の増加です。

そして、その背景にはOpenClawの推進が欠かせません。Agentがタスクを自動実行し始めると、1つの要求に対して通常は複数ラウンドの呼び出しが対応するため、Token消費が倍増して拡大します。その結果、API呼び出し量も上がっていきます。

この背景のもと、次第に業界の共通認識が形成されつつあります。大規模モデルが長期のタスク実行能力を備えるようになると、呼び出しは単発の入力・出力で止まらず、持続可能な運用を可能にするシステム化されたプロセスへと進化する、ということです。

こうした構造のもとで、Token自体が、最も直接的で、同時に最も確実な課金単位になります。

言い換えれば、モデルの能力が十分に強いとき、APIそのものが大規模モデルにおける最も明確なビジネスモデルへ収斂していくのです。

このトレンドは、大規模モデル企業の共通の選択肢になりつつあります。

海外はすでに、より早い段階で進んでいます。Anthropicの約80%の売上は、企業向けのAPI呼び出しサービスから生まれており、本質的にはToken消費に紐づいた課金体系です。

国内でも、急速にこの構造へ寄ってきています。

現在、国内の主流な基盤モデル企業、たとえば智谱AI、MiniMax、月の暗夜(ムーン・デス・オブ・ザ・ナイト)などのコア収益は、徐々にAPI呼び出しへ収斂しており、MaaS(Model as a Service)が成長を受け止める主要なルートになっています。

智谱の経営陣は電話会議で、現在のAPIサービスARRは約2.5億ドルで、年末までに10億ドルに到達する見込みだと明確に述べています。今後、同社は標準化されたAPIサービスにより重点を置くことになるでしょう。2026年には、APIサービスとローカル配備がそれぞれ約半分になる見込みです。その後2〜3年で、重心はさらにAPI側へ傾くとされています。

同様の変化はMiniMaxでも起きています。

2025年、オープンプラットフォームと企業向けサービスの売上は2,596.3万ドルに達し、前年同期比197.8%増でした。収益構成比は28.6%から32.8%へ上昇しています。

2026年2月時点で、同社のARRは1.5億ドルを超えています。2025会計年度の7,900万ドルと比べて倍増です。成長の中核的な駆動力も、同様にToken消費の増加にあります。特に、コーディング・アシスタントとエージェント(Agent)シナリオでの拡大が大きいといえます。

ゴールドマン・サックスの予測では、2026年にMiniMaxがオープンプラットフォーム(API)から得る売上構成比は約40%に達する見込みです。

大規模モデルのビジネスモデルが収束していくことは、価値の測り方もより明確になることを意味します。「能力指標」から「Token計測」へと移るのです。

/ 02 /

ルートが分岐する背景にある、2つの解き方

AIがアプリケーション段階へ入るにつれ、ある問題がより具体的になってきました。モデル能力が徐々に収斂していく中で、大規模モデルのコアとなる競争力は結局何なのでしょうか。

この問いに対して、智谱とMiniMaxは2通りの異なる答えを示しています。

智谱のロジックは、極限までのモデル上限を追求することです。

張鹏はTAC(Token Architecture Capability、Tokenアーキテクチャ能力)という概念を提起しています。本質的には、次の3点に分解できます。呼び出し規模、呼び出しの品質、そして収益へ転換する能力です。

その核心的判断は「知性の質が、価格決定権を左右する」ということです。

智谱の判断はこうです。「Agentの進化に伴い、Tokenも階層化され、低複雑度・標準化されたtokenは低価格、あるいは無料へ向かう。持続的な価格決定権を持つのは、高複雑度で高信頼性の高品質tokenだけだ」。

この点はすでにデータ上でも示されています。第1四半期に、智谱のAPI価格は83%引き上げられましたが、需要は縮小しませんでした。むしろ供給不足のような状態で、呼び出し量の増加は400%に達しています。

もし智谱AIが「質が価格決定権を決める」という話をしているのであれば、MiniMaxは実際には別のロジック、つまり「経路の差別化」と「効率」から競争力が生まれるという考え方です。

MiniMaxは、主流ではないルートを選びました――テキスト、ビデオ、音声、音楽の4つのモダリティを並行して推進する全モーダルの自社開発です。これは、現状の大規模モデル企業の中では珍しくありません。

このルートの核心は、「多いこと」ではなく、「広がり」です。

闫俊杰の見方によれば、AI時代のプラットフォーム企業の価値とは、本質的に「インテリジェンス密度 × Tokenのスループット量」です。

マルチモーダルの意味は、知能密度を大きく下げることなくTokenのスループットを拡大することです。なぜなら変えるのは能力の上限ではなく、利用のハードルだからです。

製品に画像や音声などのインタラクション方式を追加すると、ユーザーの理解コストと操作のハードルは明確に下がり、ユーザー層もより幅広く拡大します。たとえば、これまでカバーしづらかった高齢者や子どもなども含めてです。

これは実は、モバイル・インターネットでも一度起きたことがあります。図や文字中心の情報フローから、短編動画の爆発へ――本質的にどちらも、インタラクションのハードルを下げることで、浸透率の急進をもたらしたのです。

次に効率です。MiniMaxのもう一つの主軸は、極めて高いリソース活用効率です。

2025年、同社の研究開発投資は2.53億ドルで、前年同期比33.8%増でした。これは、売上増速の158.9%を明らかに下回っています。

それに対して智谱AIの戦略は、より「思い切り攻めて勝つ」に近いといえます。

2025年、智谱の売上は7.24億元で、研究開発費は31.8億元でした。研究開発費率は実に439%です。同期間のMiniMaxは売上5.4億元で、研究開発費は17.43億元、研究開発費率は323%です。

経営効率では、智谱は1元の収入を得るのに対し、約4.4元の損失が対応します。MiniMaxは3.2元です。人員効率では、智谱は約66万元で、MiniMaxは126万元に達しています。

もちろん、これには一部ビジネスモデルの差もあります。MiniMaxは製品収益への依存がより高く、智谱は依然としてローカル配備が中心です。

しかしそれでも、2つのルートが分岐していることははっきりしています。

一方は「知性の上限」を追求し、能力を高めることで価格決定権を取りに行くこと。

もう一方は「効率とカバー範囲」を最適化し、利用規模を拡大してTokenのスループットを増やすこと。

本質的には、同じ公式のもとで、まったく異なる2つの解き方です。

/ 03 /

寡占の構図こそが、基盤モデル事業の最大の確実性

バリュエーションはさておき、モデル企業のこのビジネスは、実際にはすでに比較的明確な輪郭が見え始めています。

基盤モデルのビジネスは、従来のソフトウェアとは違います。

従来のソフトウェアは、最初は高い投資を行い、後半で徐々に回収します。しかし基盤モデルは違います。コストは段階的に上がっていく一方で、収入は必ずしも同じだけ厚くならず、むしろ競争が激化する中で、継続的に圧縮されていく可能性があります。

この観点から見ると、これは「生まれつき脆弱な構造」により近いと言えます。けれど面白いのは、その構造がむしろ別の結果へつながることです。

それは自然に寡占へ向かう、ということです。

なぜなら、このレベルの投資を継続的に耐えられるのは、極めて少数の企業だけだからです。ビジネスの形としては、電池や半導体工場のようなものに近い。最初の投資は非常に大きいが、一度ポジションを確保できれば、競争相手はほとんどいない。そしてパイも十分に大きい。

同時に、大規模モデルにはもう一つ、より微妙な点があります。それは、完全な「勝者総取り」の市場というわけではなく、むしろ「階層化された市場」に近いことです。

最上位のモデルは、たとえ効果が5%しか優れていなくても、コーディングなど効率重視の複雑なシナリオでは50%以上のプレミアムへと拡大されます。これは乗数効果によって決まります。

しかし同時に、すべてのタスクに最強モデルが必要なわけではありません。

そのため市場は自然に階層化します。最上位はプレミアムを取り、中層は規模で回し、最下層はロングテール需要を受け止める。さらに、階層間である種の「Tokenの流動」さえ生まれます――複雑なタスクは上へ、単純なタスクは下へ向かうのです。

仮に全体のSOTA(最高水準)ができなくても、ある特定の分野でSOTAになれば、それも成立するルートです。

そしてこの構造の中では、効率も非常に重要な変数になります。

なぜなら、この業界にはほぼネットワーク効果がなく、ユーザーの乗り換えコストは極めて低いからです。つまり、ある会社が「90点」のモデルを作れるとともに、価格がより安ければ、すぐに規模を獲得できるのです。

このプロセスで、効率は商業化の過程でも重要な変数になります。

ネットワーク効果がないため、ユーザーの乗り換えコストが低い。だからこそ、ある会社が「90点」のモデルを作り、かつ価格がより低ければ、迅速に規模を拡大できるのです。

理由は非常にシンプルで、一部のシナリオでは最強モデルが必ずしも必要ではありません。効果の差が限定的であれば、価格が決定的な要因になります。

そして価格の本質はコストです。これは技術だけでなく、計算資源や電力など、一連のコスト差にも左右されます。

例えば中国の場合、エンジニアリング最適化、規模化されたデプロイ、そしてより低い電力コストによって、推論コストを大幅に引き下げられます。これにより、同等の能力を持つモデルでも、より低い価格でTokenサービスを外部に提供できるのです。

現在、中国の一部のモデル企業が海外へ進出する本質は、ある意味で「Tokenの価格差(スプレッド)」を取る商売をしていることにあります。

もちろん、売上成長の源泉は爆発的な需要と寡占の市場構造です。ただし、これは楽観しすぎてもいけません。競争環境の違いにより、中米のAPI販売には多くの違いがあるからです。

たとえば米国では、大規模モデルのエコシステムが開発者のロングテール需要により強く依存しており、企業顧客や開発者が能力に対してより支払い意思を持ちやすいため、モデル性能がそのままプレミアムへ転換されやすいのです。

一方、国内では呼び出しがヘッド顧客により集中しています。インターネット・プラットフォームや政企顧客です。加えて供給側での競争があるため、Tokenのプレミアムはおそらく長期にわたって維持されないでしょう。

ある程度まで言えば、米国では基盤モデルはソフトウェアやプラットフォームとの結びつきがより強い存在であり、中国ではむしろ基盤インフラの一部に近いと言えます。

この観点から言うと、国内の大規模モデル企業のビジネスモデルはどこまでの水準まで到達できるのか――それは、今後さらに見ていく必要があるでしょう。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン