撰稿:涨声 Beatz
AI相場が再び急落。今回はMetaが、余剰のAI計算リソースを販売する可能性を示唆したためだ。
このニュースが3年前にあれば、おそらく誰も驚かなかっただろう。クラウドコンピューティングはそもそも、サーバーを細分化して他社に販売するビジネスだ。Amazon、Microsoft、Googleは長年そうしてきた。CoreWeaveやNebiusといった新興クラウド事業者も、その道でNVIDIAのチップを融資の担保に変え、さらに多くのチップを購入している。
しかし、Metaとなると話は別だ。
過去、Metaは計算リソースをそのように捉えてこなかった。同社はチップを購入し、データセンターを建設し、電力や土地を確保してきた。それは自社のモデル、広告システム、レコメンドフィード、そしてザッカーバーグが口にする「ますます近づくスーパーインテリジェンス」のためだ。Metaはクラウド事業者ではない。これまで、マシンを他社にレンタルして収益を上げることはなかった。
かつてある企業が「可能な限り多くのマシンが必要だ。将来、それらをすべて使い切るからだ」と言った。今、その企業は「これらのマシンが一時的に余るなら、他社に売ってもいい」と言っている。
これは計算リソースの過剰を直接示すものではないが、軽く流すこともできない。
株価が急落した日、PalantirのCEOアレックス・カープはCNBCのインタビューで、約20分間カメラに向かって怒りをぶちまけた。
彼は元々、PalantirとNVIDIAの新たな提携について語る予定だったが、すぐに話題はOpenAIやAnthropicのトークン課金モデルに移った。彼は、CEOたちがプライベートで「企業のAI導入は、何の価値も生み出さないトークンにお金を払い、さらに自社のデータまで差し出している」と不満を漏らしていると述べた。そして、高騰するモデル利用料を「企業に課せられる富裕税」と呼んだ。
過去2年間、誰が大胆に投資するか、誰がより速く投資するか、誰が真っ先にデータセンターを積み上げるかが議論されてきた。今、問題は徐々に変わってきている。マシンを購入した後、誰がそれらをフル稼働し続けられるか。
Metaの提案はまだ正式な事業にはなっていない。公開報道によると、社内に「Meta Compute」という方向性があり、生の計算リソースを販売するか、Amazon Bedrockのようにさまざまなモデルを自社インフラ上で提供する可能性がある。ザッカーバーグは以前の株主総会で、外部企業からほぼ毎週「APIサービスや計算リソースの一部を購入したい」と打診があり、Metaのコストを上回る価格を提示しても構わないと言われていると述べた。
彼はその時、こうも付け加えた。「まだそうしていない。Metaは自社でこれらの計算リソースを使い切れると考えているからだ。」
使い切れるのであれば、レンタルは選択肢の一つだ。使い切れなければ、レンタルはバランスシートの鎮痛剤となる。
最も判断が難しいのはここだ。Metaは単に建設のペースに一時的な余裕ができ、空いたリソースを販売しているだけかもしれない。あるいは、投資家に対して「1000億ドル規模のAI支出を遠い将来のスーパーインテリジェンスだけで支えることはできない。もっと近い収益源を見つけなければならない」と伝えている可能性もある。
どちらの説明も成り立つ。
設備投資(Capex)は、AIストーリーの中核であり、それ以外にない。2021年の金融緩和と同様に、Capexの期待が継続的に拡大し、緩和が続くことで、市場で取引されるすべてのセクターが上昇する。Metaが計算リソースの販売を準備していると聞いて、多くの人の最初の反応は「AIのCapexが崩壊する」というものだ。大企業がついに買い過ぎたことを認め、半導体の宴は終わった。
それはあまりにも単純すぎる。
公開データは、まだそのような断定的な結論を支持していない。AWSの第1四半期の売上高は28%増の376億ドルで、ここ数年では珍しい高成長だ。Google Cloudの第1四半期の成長はさらに急で、売上高は200億ドルに達した。Microsoft Azureも約40%の成長率を維持している。
Amazonは今年の設備投資が2000億ドルに達する可能性があると述べ、Alphabetは2026年の設備投資ガイダンスを1800億~1900億ドルに引き上げ、Meta自身も年間設備投資を1250億~1450億ドルに引き上げた。
これらの数字は、需要の崩壊を示しているようには見えない。
むしろ、需要の分流のように見える。
クラウド事業者とモデル事業者の状況は異なる。クラウド事業者が販売しているのは「道」だ。その道を走る者がいれば、車が誰のものであれ、料金を徴収できる。OpenAI、Anthropic、企業顧客、政府顧客、スタートアップは、最終的にいずれかのデータセンター、ある種のチップ、あるネットワーク、ある電力契約に落ち着く。
したがって、三大クラウドは強気を維持できる。
AWSは6月末に、AIクラウドサービスの価格を引き上げた。これは顧客がGPUを事前に予約するサービスで、AWSはこのサービスの7月からの価格を約20%引き上げた。1月にも約15%の値上げを実施している。これは需要が軟調な場合に見られる動きではない。
希少性があるとき、売り手は値上げする。
しかし、モデル企業がすべて同じように快適でいられるとは限らない。
モデル企業の資産はより選別的だ。計算リソースは、そこにあるだけで収益を生むわけではない。より賢いモデル、より頻繁なユーザー、より高額なエンタープライズワークフローによって常に満たされる必要がある。モデルが十分に優れている場合にのみ、ユーザーは待ち行列、制限、値上げ、複雑化するサブスクリプション階層を受け入れる。
これが、Anthropicが市場で別の種類の企業と見なされる理由でもある。安いからではなく、ユーザーが高額なタスクを任せたいからだ。コードの作成、システムの修正、長時間のタスク実行、エンタープライズワークフローへの統合。これらのタスクが実際に本番環境に入ると、消費するトークンは雑談よりもはるかに多くなる。
強力なモデルの悩みはマシンが不足することだ。
弱いモデルの悩みはマシンを惜しむ人がいないことだ。
どちらの悩みも「計算リソース」と呼ばれるが、同じものではない。
xAIの動きにも同じ匂いがする。Grokは最強モデルのように明確なエンタープライズマインドセットを形成していないが、マスクのシステム内の計算リソースの一部はAnthropicに流れる可能性がある。この動きは、どんなスローガンよりも冷静だ。マシンは創業者を認識しない。マシンをフル稼働させられる者だけを認識する。
GoogleとMetaの関係も、事態がそれほど単純でないことを示している。6月、GoogleがMetaによるGeminiの利用を制限したとの報道があった。理由は、Metaが購入を希望する計算リソースがGoogleの提供範囲を超え、Meta社内の一部のAIプロジェクトに影響を与えたためだという。ある企業が計算リソースの販売を検討する一方で、特定のタスクではトップクラスのモデル能力を十分に購入できない。
これは従来の意味での過剰ではない。
これはミスマッチだ。請求書が目立ち始めたからだ。
クラウド事業者は値上げを続けられる。彼らが販売するのは確実性だからだ。顧客は、一定期間確実に入手できるGPU、安定したデータセンター、夜中に停止しないインフラを必要としている。
しかし、企業顧客が計算リソースを入手しても、問題は終わらない。
彼らはその請求書をCFOに提出しなければならない。CFOは「何トークン使ったか」とは聞かない。「これらのトークンが会社のためにいくら節約したか、いくら利益を増やしたか、いくらミスを減らしたか」を尋ねる。
冒頭のカープのインタビューに戻る。
彼は、多くのAI企業が企業に販売しているものを「過剰販売」と呼んだ。インタビューの前日、PalantirはXで「AI主権」に関する9つのポイントの声明を発表し、その中で特に「トークンマクシング」と呼ばれるモデルを批判した。この言葉は直訳すると不快だが、意味は複雑ではない。すなわち、トークンを消費することを進歩とみなし、金を燃やすことを利用とみなし、請求書を生産性とみなすことだ。
カープはOpenAIやAnthropicといった最先端の研究所を引き合いに出した。彼の意図は、企業が最強のモデルを使うべきでないということではなく、企業が自社のデータ、プロセス、ビジネス判断をすべて委ね、さらに消費量に応じて増大する請求書を支払うべきでないということだ。
Palantirが販売したいのは別のものだ。汎用的なチャットボックスでも、単一のAPIでもない。データ、承認、権限、運用ルール、AIを同じビジネスシステムに統合することだ。顧客がお金を払うのは「AIを使用した回数」ではなく、特定の生産ライン、特定のリスク管理フロー、特定の政府タスクが実際に改善されたかどうかだ。
企業の実際に予算を管理する人々は、目覚め始めている。
UBSが最近企業のIT幹部と話し合った結果、一つの方向性が明確になった。多くの企業はAIをやめているのではなく、AIへの支出にブレーキをかけている。約60%の回答企業がトークン支出を抑制し、利用にガードレールを設けている。特に、試用期間を過ぎてAIを日常業務に組み込み始めた企業で顕著だ。
これは非常に興味深い反転でもある。
AIが「おもちゃ」から「道具」になると、支出はかえって難しくなる。「おもちゃ」の段階では、経営陣は予算を承認する。なぜなら、誰もが「取り残される」ことを恐れるからだ。「道具」の段階では、CFOが「これは誰の作業時間を節約したか、誰の売上を増やしたか、誰のリスクを低減したか」を尋ねる。
この表において、トークンは収入ではない。
むしろ、電力メーターに似ている。
もちろん、電力メーターが速く回転しているのは工場が稼働している証拠だと言える。また、電力メーターの回転が速すぎるのに生産量が上がっていないのは、その機械に問題があると言うこともできる。
AIエージェントはこの問題を拡大した。OpenAIといくつかの大学によるCodexの研究には驚くべきデータがある。2026年前半、Codexのアクティブユーザーは5倍以上に増加した。OpenAI社内の一部の役職では、出力トークンが急増し、法務職の月間中央値出力トークンは2025年11月と比較して13倍、研究職では50倍以上になった。
別の研究はさらに具体的だ。エージェント型コーディングタスクが消費するトークンは、通常のコードチャットやコード推論と比較して1000倍になる可能性がある。同じタスクでも、実行ごとのトークン消費は30倍も異なる可能性がある。
これこそが、今日の計算リソース不足の根底にあるものだ。
単にチャットボットに多くの質問をしたからではない。
ソフトウェアが、ファイルを繰り返し読み、コマンドを実行し、コードを修正し、失敗し、やり直し、再び失敗し、再びやり直す、小さなワーカーの集団になりつつあるからだ。彼らには昼食時間はないが、すべてのステップでトークンを消費する。
トークンが電力メーターになったとき、発電所を所有する者が権力を持つ。しかし、電力を無駄にする者は、真っ先に詰問される。
CFOがこの電力メーターを見始めると、次のステップはほぼ自明だ。
彼は尋ねるだろう。「どのタスクに最強のモデルが必要で、どのタスクに十分なモデルで済むのか?」
その時、GLM、Kimi、DeepSeek、Qwenといったオープンソースモデルは、単なる技術ニュースではなくなる。それらは、企業の購買部門の交渉の道具になる。
シリコンバレーのトップVCであるa16zのマーク・アンドリーセンでさえ、多くのAI関係者はすでに智譜(Zhipu)のGLM-5.2を、ほとんどのタスクで米国のトップ公開モデルに匹敵するか、それを上回る最初の中国モデルと見なしていると述べている。この判断が最終的な結論ではないにせよ、企業に選択肢を与える。
Coinbaseはより具体的な例を示した。ブライアン・アームストロングは、同社がデフォルトのAIモデルをGLM 5.2、Kimi 2.7などのオープンソースモデルに切り替え、モデルルーティング、キャッシュ、コンテキストの削減と組み合わせることで、トークン使用量は指数関数的に増加しているにもかかわらず、AI支出をほぼ半分に削減したと述べた。
この発言の破壊力は、企業が初めてモデル能力を分解して調達できるようになったことにある。
最も難しいタスクは、引き続き最も高価なモデルに任せる。一般的な要約、カスタマーサポート、情報抽出、テンプレートコード、社内ナレッジベースのQ&Aは、安価なモデルやオンプレミスデプロイに任せる。
オープンソースモデルは、すべての戦場で勝利する必要はない。
購買部門に、すべての電力代を高級住宅の電気代と同じように払う必要はないと信じ込ませれば十分だ。
ここにきて、Metaの計算リソース販売は、孤立したニュースではなくなる。
それは、Palantirがトークンを批判し、Coinbaseがオープンソースモデルを採用したことと同じことを語っている:AIの支出チェーンが分解され始めている。上流は確実性を、中流は結果を、下流は単価を抑える。各層は依然として成長しているが、各層は「その支出は価値があるのか」と問われ始めている。
過去2年間、AI業界で最も語りやすいストーリーは「リソース不足」だった。
GPUが足りない、電力が足りない、データセンターが足りない、エンジニアが足りない、モデルを実行できるクラウドも足りない。このストーリーはあまりにもスムーズだ。何かが足りなければ、誰もが本能的に前進する。まず場所を確保し、まず電力を契約し、まずチップを購入し、まずマシンを設置する。
リソースを奪い合うとき、人々は細かい計算をあまりしない。
なぜなら、一歩遅れることの代償の方が大きく見えるからだ。
しかし、Metaのニュースは別の問題を浮き彫りにした。マシンを購入しても、それが高価だからといって自動的に良いビジネスにはならない。毎日仕事があり、顧客が喜んでお金を払い、モデルがそれをフル稼働させ、アプリケーションがコストを収益に変換する必要がある。
これが「稼働率」だ。
稼働率という言葉は冷たく聞こえるが、実際は残酷だ。それは「未来があるかどうか」ではなく、「今日、このマシンは稼働しているか」を問う。記者会見で何を言ったかは関係ない。最も高価なGPUを買ったかどうかも関係ない。ただ一つだけを見る:そのお金が持続的なキャッシュフローになっているかどうか。
クラウド事業者はこの質問に比較的答えやすい。彼らはもともとインフラを販売している。AWS、Google Cloud、Azureは「道」「電力」「サーバールーム」を販売している。顧客がモデルを訓練し、推論を実行し、アプリケーションをホストするには、最終的にいずれかのクラウドに落ち着く必要がある。
したがって、彼らは強気を維持できる。
強力なモデル企業にも独自の答えがある。モデルが十分に強力であれば、ユーザーは待ち行列を受け入れ、企業は接続し、開発者はその周りでワークフローを変更する。そうなれば、計算リソースは在庫ではなく、ボトルネックになる。マシンが多ければ多いほど、より速く実行できる。
最も難しいのは中間層だ。
彼らはマシン、ストーリー、モデルチーム、そして大きな予算を持っている。しかし、モデルは最前線に立っておらず、製品は日常的な習慣になっておらず、開発者はそのためにワークフローを変更しようとしない。この種の企業にとって、計算リソースは武器から在庫に変わる。それは、たった一度のモデルリリースの失敗や、一度のユーザー移行で起こる。
在庫は必ずしも役に立たないわけではない。
しかし、在庫は値下げし、レンタルし、新しい用途を見つけなければならない。
これこそが、Metaの計算リソース販売が目立つ理由だ。それはMetaの失敗を証明するものではなく、AI需要の消滅を証明するものでもない。それは単に、市場が初めて、AIインフラも普通の工場と同じ問題に直面することを目撃しただけだ。
工場は完成した。注文はどこにあるのか。
したがって、この問題を最もよく理解する方法は「計算リソースの過剰」ではない。
その言葉は粗すぎる。
より正確な表現は「計算リソースの階層化が始まった」である。
最上位層は依然として逼迫している。最強のモデル、最高のクラウド、最も安定したGPUクラスターは、依然として争奪戦となっている。AWSのサービスが値上げできるのは、確実性そのものに価格があるからだ。顧客は単にGPUを買うのではなく、特定の日、特定の時間、特定のバッチのマシンが確実に利用できることを買う。
中間層は気まずくなり始めている。悪くはないかもしれないが、希少性はない。モデルを実行でき、推論も可能で、外部顧客にも販売できる。しかし、顧客は比較し、値切り、「なぜもっと安いモデルを使わないのか」「なぜ他人のクラウドを使わないのか」「なぜこのバッチのマシンがこの価格に見合うのか」と問う。
最下位層は、オープンソースモデルとコスト最適化によって徐々に圧迫される。企業は一般的なタスクのために、常に最も高価なモデルを呼び出すことはしない。ルーティング、キャッシュ、コンテキストの削減を行い、モデルを異なるグレードに分割する。
需要は成長した。
子供は請求書を見ずにお金を使うが、大人は見る。AIが企業に浸透すれば、同じプロセスを経る。試行段階では、誰もが取り残されることを恐れる。規模拡大段階では、誰もが計算を始める。
計算が始まれば、産業チェーンは初期のように一様ではなくなる。
ある者は値上げを続ける。なぜなら、彼らは代替不可能な確実性を販売しているからだ。ある者は結果の販売に切り替える。なぜなら、顧客は消費そのものにお金を払いたくないからだ。ある者は値下げを余儀なくされる。なぜなら、十分な代替品が現れたからだ。ある者はマシンをレンタルする。なぜなら、マシンが遊休状態にあることは、低価格でのレンタルよりも見苦しいからだ。
これらのことが同時に起こると、業界は矛盾しているように見える。
一方では計算リソースが逼迫している。
一方では計算リソースがレンタルされている。
一方ではトークン消費が急増している。
一方では企業がAI支出を抑制している。
一方ではトップモデルがますます強力になっている。
一方ではオープンソースモデルがますます安価になっている。
これらは矛盾しているわけではない。それらは単に、AIが「総量ストーリー」から「構造ストーリー」に移行したことを示している。
19世紀の鉄道バブルにおいて、鉄道自体は偽物ではなかった。
線路が敷かれれば、実際に貨物は動き、都市は成長し、時間は短縮された。後に最も価値のある商業ネットワークの多くは、実際にそれらの線路のそばに形成された。
しかし、それは当時、多くの鉄道建設者が損失を出したことを妨げなかった。
彼らが負けたのは方向性ではない。彼らは早すぎた、多すぎた、旅客や貨物の流れのない場所に建設した、あるいは回収に時間がかかりすぎる線路のために高すぎる借金をしたのだ。
インターネットバブルにおける光ファイバーも同じだ。光ファイバーは間違っていなかった。後に世界全体がそれによって支えられた。間違っていたのは、将来数十年分の需要をわずか数年の設備投資に詰め込んだあの会計帳簿だった。
AIデータセンターも、多くの有用なものを残すかもしれない。GPUは減価償却され、電力契約は更新され、データセンターは設備を交換し、ソフトウェアはますます計算リソースを消費するようになる。今日、誇張に見えるトークン消費も、数年後には高精細ビデオトラフィックのように普通に見えるかもしれない。
しかし、資産にはそれ自身の性質がある。
それは、あなたが未来を信じているかどうかには関心がない。毎日誰かが使いに来るかどうかだけに関心がある。
Metaの計算リソース販売のシグナルは、まさにこの点にある。
それはAIの終着点ではない。半導体の終着点でもない。それはむしろ、設備投資のストーリーが中盤に差し掛かったとき、初めて誰かがドアを開け、倉庫にどれだけのマシンがあるかを外に見せたようなものだ。
一部のマシンはトップモデルによって消費される。
一部のマシンはクラウド顧客によってレンタルされる。
一部のマシンは価格競争で安くなる。
そして、まだ出現していないアプリケーションを静かに待つマシンもある。
過去2年間、市場はすべてのマシンが最終的に自らの運命を見つけると信じていた。今、市場は「誰が先に見つけるのか、誰が見つけられないのか、誰が見つけても十分な利益を得られないのか」を問い始めている。
この問題が提起された瞬間、AIのストーリーは変わった。
それはもはや、最も速くマシンを購入した者だけのものではない。
それは、マシンを回し続けられる者のものとなった。
原文リンク
クリックして律动BlockBeatsの求人情報を確認
律动 BlockBeats 公式コミュニティにご参加ください:
Telegram 購読グループ: https://t.me/theblockbeats
Telegram 交流グループ: https://t.me/BlockBeats_App
Twitter 公式アカウント: https://twitter.com/BlockBeatsAsia
530.22K 人気度
4.16M 人気度
67.51K 人気度
160.67K 人気度
117.98K 人気度
Metaが計算力を売り、Palantirが罵倒し、智譜がシリコンバレーの寵児に——AIケイパックスの物語は語り方を変える必要がある。
AI相場が再び急落。今回はMetaが、余剰のAI計算リソースを販売する可能性を示唆したためだ。
このニュースが3年前にあれば、おそらく誰も驚かなかっただろう。クラウドコンピューティングはそもそも、サーバーを細分化して他社に販売するビジネスだ。Amazon、Microsoft、Googleは長年そうしてきた。CoreWeaveやNebiusといった新興クラウド事業者も、その道でNVIDIAのチップを融資の担保に変え、さらに多くのチップを購入している。
しかし、Metaとなると話は別だ。
過去、Metaは計算リソースをそのように捉えてこなかった。同社はチップを購入し、データセンターを建設し、電力や土地を確保してきた。それは自社のモデル、広告システム、レコメンドフィード、そしてザッカーバーグが口にする「ますます近づくスーパーインテリジェンス」のためだ。Metaはクラウド事業者ではない。これまで、マシンを他社にレンタルして収益を上げることはなかった。
かつてある企業が「可能な限り多くのマシンが必要だ。将来、それらをすべて使い切るからだ」と言った。今、その企業は「これらのマシンが一時的に余るなら、他社に売ってもいい」と言っている。
これは計算リソースの過剰を直接示すものではないが、軽く流すこともできない。
株価が急落した日、PalantirのCEOアレックス・カープはCNBCのインタビューで、約20分間カメラに向かって怒りをぶちまけた。
彼は元々、PalantirとNVIDIAの新たな提携について語る予定だったが、すぐに話題はOpenAIやAnthropicのトークン課金モデルに移った。彼は、CEOたちがプライベートで「企業のAI導入は、何の価値も生み出さないトークンにお金を払い、さらに自社のデータまで差し出している」と不満を漏らしていると述べた。そして、高騰するモデル利用料を「企業に課せられる富裕税」と呼んだ。
過去2年間、誰が大胆に投資するか、誰がより速く投資するか、誰が真っ先にデータセンターを積み上げるかが議論されてきた。今、問題は徐々に変わってきている。マシンを購入した後、誰がそれらをフル稼働し続けられるか。
Metaの提案はまだ正式な事業にはなっていない。公開報道によると、社内に「Meta Compute」という方向性があり、生の計算リソースを販売するか、Amazon Bedrockのようにさまざまなモデルを自社インフラ上で提供する可能性がある。ザッカーバーグは以前の株主総会で、外部企業からほぼ毎週「APIサービスや計算リソースの一部を購入したい」と打診があり、Metaのコストを上回る価格を提示しても構わないと言われていると述べた。
彼はその時、こうも付け加えた。「まだそうしていない。Metaは自社でこれらの計算リソースを使い切れると考えているからだ。」
使い切れるのであれば、レンタルは選択肢の一つだ。使い切れなければ、レンタルはバランスシートの鎮痛剤となる。
最も判断が難しいのはここだ。Metaは単に建設のペースに一時的な余裕ができ、空いたリソースを販売しているだけかもしれない。あるいは、投資家に対して「1000億ドル規模のAI支出を遠い将来のスーパーインテリジェンスだけで支えることはできない。もっと近い収益源を見つけなければならない」と伝えている可能性もある。
どちらの説明も成り立つ。
需要は消えていない。選別が始まっただけだ。
設備投資(Capex)は、AIストーリーの中核であり、それ以外にない。2021年の金融緩和と同様に、Capexの期待が継続的に拡大し、緩和が続くことで、市場で取引されるすべてのセクターが上昇する。Metaが計算リソースの販売を準備していると聞いて、多くの人の最初の反応は「AIのCapexが崩壊する」というものだ。大企業がついに買い過ぎたことを認め、半導体の宴は終わった。
それはあまりにも単純すぎる。
公開データは、まだそのような断定的な結論を支持していない。AWSの第1四半期の売上高は28%増の376億ドルで、ここ数年では珍しい高成長だ。Google Cloudの第1四半期の成長はさらに急で、売上高は200億ドルに達した。Microsoft Azureも約40%の成長率を維持している。
Amazonは今年の設備投資が2000億ドルに達する可能性があると述べ、Alphabetは2026年の設備投資ガイダンスを1800億~1900億ドルに引き上げ、Meta自身も年間設備投資を1250億~1450億ドルに引き上げた。
これらの数字は、需要の崩壊を示しているようには見えない。
むしろ、需要の分流のように見える。
クラウド事業者とモデル事業者の状況は異なる。クラウド事業者が販売しているのは「道」だ。その道を走る者がいれば、車が誰のものであれ、料金を徴収できる。OpenAI、Anthropic、企業顧客、政府顧客、スタートアップは、最終的にいずれかのデータセンター、ある種のチップ、あるネットワーク、ある電力契約に落ち着く。
したがって、三大クラウドは強気を維持できる。
AWSは6月末に、AIクラウドサービスの価格を引き上げた。これは顧客がGPUを事前に予約するサービスで、AWSはこのサービスの7月からの価格を約20%引き上げた。1月にも約15%の値上げを実施している。これは需要が軟調な場合に見られる動きではない。
希少性があるとき、売り手は値上げする。
しかし、モデル企業がすべて同じように快適でいられるとは限らない。
モデル企業の資産はより選別的だ。計算リソースは、そこにあるだけで収益を生むわけではない。より賢いモデル、より頻繁なユーザー、より高額なエンタープライズワークフローによって常に満たされる必要がある。モデルが十分に優れている場合にのみ、ユーザーは待ち行列、制限、値上げ、複雑化するサブスクリプション階層を受け入れる。
これが、Anthropicが市場で別の種類の企業と見なされる理由でもある。安いからではなく、ユーザーが高額なタスクを任せたいからだ。コードの作成、システムの修正、長時間のタスク実行、エンタープライズワークフローへの統合。これらのタスクが実際に本番環境に入ると、消費するトークンは雑談よりもはるかに多くなる。
強力なモデルの悩みはマシンが不足することだ。
弱いモデルの悩みはマシンを惜しむ人がいないことだ。
どちらの悩みも「計算リソース」と呼ばれるが、同じものではない。
xAIの動きにも同じ匂いがする。Grokは最強モデルのように明確なエンタープライズマインドセットを形成していないが、マスクのシステム内の計算リソースの一部はAnthropicに流れる可能性がある。この動きは、どんなスローガンよりも冷静だ。マシンは創業者を認識しない。マシンをフル稼働させられる者だけを認識する。
GoogleとMetaの関係も、事態がそれほど単純でないことを示している。6月、GoogleがMetaによるGeminiの利用を制限したとの報道があった。理由は、Metaが購入を希望する計算リソースがGoogleの提供範囲を超え、Meta社内の一部のAIプロジェクトに影響を与えたためだという。ある企業が計算リソースの販売を検討する一方で、特定のタスクではトップクラスのモデル能力を十分に購入できない。
これは従来の意味での過剰ではない。
これはミスマッチだ。請求書が目立ち始めたからだ。
クラウド事業者は値上げを続けられる。彼らが販売するのは確実性だからだ。顧客は、一定期間確実に入手できるGPU、安定したデータセンター、夜中に停止しないインフラを必要としている。
しかし、企業顧客が計算リソースを入手しても、問題は終わらない。
彼らはその請求書をCFOに提出しなければならない。CFOは「何トークン使ったか」とは聞かない。「これらのトークンが会社のためにいくら節約したか、いくら利益を増やしたか、いくらミスを減らしたか」を尋ねる。
企業にとってトークンは電力メーターとなる
冒頭のカープのインタビューに戻る。
彼は、多くのAI企業が企業に販売しているものを「過剰販売」と呼んだ。インタビューの前日、PalantirはXで「AI主権」に関する9つのポイントの声明を発表し、その中で特に「トークンマクシング」と呼ばれるモデルを批判した。この言葉は直訳すると不快だが、意味は複雑ではない。すなわち、トークンを消費することを進歩とみなし、金を燃やすことを利用とみなし、請求書を生産性とみなすことだ。
カープはOpenAIやAnthropicといった最先端の研究所を引き合いに出した。彼の意図は、企業が最強のモデルを使うべきでないということではなく、企業が自社のデータ、プロセス、ビジネス判断をすべて委ね、さらに消費量に応じて増大する請求書を支払うべきでないということだ。
Palantirが販売したいのは別のものだ。汎用的なチャットボックスでも、単一のAPIでもない。データ、承認、権限、運用ルール、AIを同じビジネスシステムに統合することだ。顧客がお金を払うのは「AIを使用した回数」ではなく、特定の生産ライン、特定のリスク管理フロー、特定の政府タスクが実際に改善されたかどうかだ。
企業の実際に予算を管理する人々は、目覚め始めている。
UBSが最近企業のIT幹部と話し合った結果、一つの方向性が明確になった。多くの企業はAIをやめているのではなく、AIへの支出にブレーキをかけている。約60%の回答企業がトークン支出を抑制し、利用にガードレールを設けている。特に、試用期間を過ぎてAIを日常業務に組み込み始めた企業で顕著だ。
これは非常に興味深い反転でもある。
AIが「おもちゃ」から「道具」になると、支出はかえって難しくなる。「おもちゃ」の段階では、経営陣は予算を承認する。なぜなら、誰もが「取り残される」ことを恐れるからだ。「道具」の段階では、CFOが「これは誰の作業時間を節約したか、誰の売上を増やしたか、誰のリスクを低減したか」を尋ねる。
この表において、トークンは収入ではない。
むしろ、電力メーターに似ている。
もちろん、電力メーターが速く回転しているのは工場が稼働している証拠だと言える。また、電力メーターの回転が速すぎるのに生産量が上がっていないのは、その機械に問題があると言うこともできる。
AIエージェントはこの問題を拡大した。OpenAIといくつかの大学によるCodexの研究には驚くべきデータがある。2026年前半、Codexのアクティブユーザーは5倍以上に増加した。OpenAI社内の一部の役職では、出力トークンが急増し、法務職の月間中央値出力トークンは2025年11月と比較して13倍、研究職では50倍以上になった。
別の研究はさらに具体的だ。エージェント型コーディングタスクが消費するトークンは、通常のコードチャットやコード推論と比較して1000倍になる可能性がある。同じタスクでも、実行ごとのトークン消費は30倍も異なる可能性がある。
これこそが、今日の計算リソース不足の根底にあるものだ。
単にチャットボットに多くの質問をしたからではない。
ソフトウェアが、ファイルを繰り返し読み、コマンドを実行し、コードを修正し、失敗し、やり直し、再び失敗し、再びやり直す、小さなワーカーの集団になりつつあるからだ。彼らには昼食時間はないが、すべてのステップでトークンを消費する。
トークンが電力メーターになったとき、発電所を所有する者が権力を持つ。しかし、電力を無駄にする者は、真っ先に詰問される。
請求書が厚くなれば、安価なモデルに居場所ができる
CFOがこの電力メーターを見始めると、次のステップはほぼ自明だ。
彼は尋ねるだろう。「どのタスクに最強のモデルが必要で、どのタスクに十分なモデルで済むのか?」
その時、GLM、Kimi、DeepSeek、Qwenといったオープンソースモデルは、単なる技術ニュースではなくなる。それらは、企業の購買部門の交渉の道具になる。
シリコンバレーのトップVCであるa16zのマーク・アンドリーセンでさえ、多くのAI関係者はすでに智譜(Zhipu)のGLM-5.2を、ほとんどのタスクで米国のトップ公開モデルに匹敵するか、それを上回る最初の中国モデルと見なしていると述べている。この判断が最終的な結論ではないにせよ、企業に選択肢を与える。
Coinbaseはより具体的な例を示した。ブライアン・アームストロングは、同社がデフォルトのAIモデルをGLM 5.2、Kimi 2.7などのオープンソースモデルに切り替え、モデルルーティング、キャッシュ、コンテキストの削減と組み合わせることで、トークン使用量は指数関数的に増加しているにもかかわらず、AI支出をほぼ半分に削減したと述べた。
この発言の破壊力は、企業が初めてモデル能力を分解して調達できるようになったことにある。
最も難しいタスクは、引き続き最も高価なモデルに任せる。一般的な要約、カスタマーサポート、情報抽出、テンプレートコード、社内ナレッジベースのQ&Aは、安価なモデルやオンプレミスデプロイに任せる。
オープンソースモデルは、すべての戦場で勝利する必要はない。
購買部門に、すべての電力代を高級住宅の電気代と同じように払う必要はないと信じ込ませれば十分だ。
ここにきて、Metaの計算リソース販売は、孤立したニュースではなくなる。
それは、Palantirがトークンを批判し、Coinbaseがオープンソースモデルを採用したことと同じことを語っている:AIの支出チェーンが分解され始めている。上流は確実性を、中流は結果を、下流は単価を抑える。各層は依然として成長しているが、各層は「その支出は価値があるのか」と問われ始めている。
最も難しいのはマシンを買うことではなく、マシンを稼働させ続けることだ
過去2年間、AI業界で最も語りやすいストーリーは「リソース不足」だった。
GPUが足りない、電力が足りない、データセンターが足りない、エンジニアが足りない、モデルを実行できるクラウドも足りない。このストーリーはあまりにもスムーズだ。何かが足りなければ、誰もが本能的に前進する。まず場所を確保し、まず電力を契約し、まずチップを購入し、まずマシンを設置する。
リソースを奪い合うとき、人々は細かい計算をあまりしない。
なぜなら、一歩遅れることの代償の方が大きく見えるからだ。
しかし、Metaのニュースは別の問題を浮き彫りにした。マシンを購入しても、それが高価だからといって自動的に良いビジネスにはならない。毎日仕事があり、顧客が喜んでお金を払い、モデルがそれをフル稼働させ、アプリケーションがコストを収益に変換する必要がある。
これが「稼働率」だ。
稼働率という言葉は冷たく聞こえるが、実際は残酷だ。それは「未来があるかどうか」ではなく、「今日、このマシンは稼働しているか」を問う。記者会見で何を言ったかは関係ない。最も高価なGPUを買ったかどうかも関係ない。ただ一つだけを見る:そのお金が持続的なキャッシュフローになっているかどうか。
クラウド事業者はこの質問に比較的答えやすい。彼らはもともとインフラを販売している。AWS、Google Cloud、Azureは「道」「電力」「サーバールーム」を販売している。顧客がモデルを訓練し、推論を実行し、アプリケーションをホストするには、最終的にいずれかのクラウドに落ち着く必要がある。
したがって、彼らは強気を維持できる。
強力なモデル企業にも独自の答えがある。モデルが十分に強力であれば、ユーザーは待ち行列を受け入れ、企業は接続し、開発者はその周りでワークフローを変更する。そうなれば、計算リソースは在庫ではなく、ボトルネックになる。マシンが多ければ多いほど、より速く実行できる。
最も難しいのは中間層だ。
彼らはマシン、ストーリー、モデルチーム、そして大きな予算を持っている。しかし、モデルは最前線に立っておらず、製品は日常的な習慣になっておらず、開発者はそのためにワークフローを変更しようとしない。この種の企業にとって、計算リソースは武器から在庫に変わる。それは、たった一度のモデルリリースの失敗や、一度のユーザー移行で起こる。
在庫は必ずしも役に立たないわけではない。
しかし、在庫は値下げし、レンタルし、新しい用途を見つけなければならない。
これこそが、Metaの計算リソース販売が目立つ理由だ。それはMetaの失敗を証明するものではなく、AI需要の消滅を証明するものでもない。それは単に、市場が初めて、AIインフラも普通の工場と同じ問題に直面することを目撃しただけだ。
工場は完成した。注文はどこにあるのか。
計算リソースは消えていない。階層化が始まっただけだ。
したがって、この問題を最もよく理解する方法は「計算リソースの過剰」ではない。
その言葉は粗すぎる。
より正確な表現は「計算リソースの階層化が始まった」である。
最上位層は依然として逼迫している。最強のモデル、最高のクラウド、最も安定したGPUクラスターは、依然として争奪戦となっている。AWSのサービスが値上げできるのは、確実性そのものに価格があるからだ。顧客は単にGPUを買うのではなく、特定の日、特定の時間、特定のバッチのマシンが確実に利用できることを買う。
中間層は気まずくなり始めている。悪くはないかもしれないが、希少性はない。モデルを実行でき、推論も可能で、外部顧客にも販売できる。しかし、顧客は比較し、値切り、「なぜもっと安いモデルを使わないのか」「なぜ他人のクラウドを使わないのか」「なぜこのバッチのマシンがこの価格に見合うのか」と問う。
最下位層は、オープンソースモデルとコスト最適化によって徐々に圧迫される。企業は一般的なタスクのために、常に最も高価なモデルを呼び出すことはしない。ルーティング、キャッシュ、コンテキストの削減を行い、モデルを異なるグレードに分割する。
需要は成長した。
子供は請求書を見ずにお金を使うが、大人は見る。AIが企業に浸透すれば、同じプロセスを経る。試行段階では、誰もが取り残されることを恐れる。規模拡大段階では、誰もが計算を始める。
計算が始まれば、産業チェーンは初期のように一様ではなくなる。
ある者は値上げを続ける。なぜなら、彼らは代替不可能な確実性を販売しているからだ。ある者は結果の販売に切り替える。なぜなら、顧客は消費そのものにお金を払いたくないからだ。ある者は値下げを余儀なくされる。なぜなら、十分な代替品が現れたからだ。ある者はマシンをレンタルする。なぜなら、マシンが遊休状態にあることは、低価格でのレンタルよりも見苦しいからだ。
これらのことが同時に起こると、業界は矛盾しているように見える。
一方では計算リソースが逼迫している。
一方では計算リソースがレンタルされている。
一方ではトークン消費が急増している。
一方では企業がAI支出を抑制している。
一方ではトップモデルがますます強力になっている。
一方ではオープンソースモデルがますます安価になっている。
これらは矛盾しているわけではない。それらは単に、AIが「総量ストーリー」から「構造ストーリー」に移行したことを示している。
古い鉄道の物語が再び語られる
19世紀の鉄道バブルにおいて、鉄道自体は偽物ではなかった。
線路が敷かれれば、実際に貨物は動き、都市は成長し、時間は短縮された。後に最も価値のある商業ネットワークの多くは、実際にそれらの線路のそばに形成された。
しかし、それは当時、多くの鉄道建設者が損失を出したことを妨げなかった。
彼らが負けたのは方向性ではない。彼らは早すぎた、多すぎた、旅客や貨物の流れのない場所に建設した、あるいは回収に時間がかかりすぎる線路のために高すぎる借金をしたのだ。
インターネットバブルにおける光ファイバーも同じだ。光ファイバーは間違っていなかった。後に世界全体がそれによって支えられた。間違っていたのは、将来数十年分の需要をわずか数年の設備投資に詰め込んだあの会計帳簿だった。
AIデータセンターも、多くの有用なものを残すかもしれない。GPUは減価償却され、電力契約は更新され、データセンターは設備を交換し、ソフトウェアはますます計算リソースを消費するようになる。今日、誇張に見えるトークン消費も、数年後には高精細ビデオトラフィックのように普通に見えるかもしれない。
しかし、資産にはそれ自身の性質がある。
それは、あなたが未来を信じているかどうかには関心がない。毎日誰かが使いに来るかどうかだけに関心がある。
Metaの計算リソース販売のシグナルは、まさにこの点にある。
それはAIの終着点ではない。半導体の終着点でもない。それはむしろ、設備投資のストーリーが中盤に差し掛かったとき、初めて誰かがドアを開け、倉庫にどれだけのマシンがあるかを外に見せたようなものだ。
一部のマシンはトップモデルによって消費される。
一部のマシンはクラウド顧客によってレンタルされる。
一部のマシンは価格競争で安くなる。
そして、まだ出現していないアプリケーションを静かに待つマシンもある。
過去2年間、市場はすべてのマシンが最終的に自らの運命を見つけると信じていた。今、市場は「誰が先に見つけるのか、誰が見つけられないのか、誰が見つけても十分な利益を得られないのか」を問い始めている。
この問題が提起された瞬間、AIのストーリーは変わった。
それはもはや、最も速くマシンを購入した者だけのものではない。
それは、マシンを回し続けられる者のものとなった。
クリックして律动BlockBeatsの求人情報を確認
律动 BlockBeats 公式コミュニティにご参加ください:
Telegram 購読グループ: https://t.me/theblockbeats
Telegram 交流グループ: https://t.me/BlockBeats_App
Twitter 公式アカウント: https://twitter.com/BlockBeatsAsia