英偉達が引き起こした大バブルが崩壊しそうだ。

出典:AGIインターフェース

5月中、関税が一時停止された90日間のウィンドウ期間に、算力のコアリソースを巡る争奪戦が急激に加熱した。

「サーバーの価格が激しく変動しており、最近では1台あたりの価格が15%-20%上昇しました。関税が一時停止されたことで、元の価格での販売を再開する予定です。」南部地域のチップサプライヤーが虎嗅に明かしました。

一方で、市場供給側も新たな変数を迎えています。虎嗅が独占的に得た情報によると、英伟达のHooperシリーズの高級製品とBlackwellシリーズが国内市場にひっそりと登場しました。前者の登場時期は2024年9月頃であり、後者は最近のことです。華锐智算の関連幹部は、「異なる供給者の調達ルートはそれぞれ異なります」と述べています。この背後にある複雑なサプライチェーンネットワークは探ることができません。

(虎嗅注:2023年10月17日から、ワシントンは段階的にNVIDIAの中国向けチップの販売を停止しました。これにはA100、A800、H800、H100、H200が含まれます。最近、Hooperシリーズの最後の中国向け販売可能なH20も輸出制限リストに追加されました)

その中で、NVIDIAのHooper高級シリーズは通常H200を指し、H100チップのアップグレード版です。前者は後者よりも価格が20万ほど高いですが、効率は30%高いです。一方、BlackwellシリーズはNVIDIAの高級シリーズに属し、B200の価格は300万を超え、現在「流通制限」が最も厳しい製品で、その流通経路はさらに秘密です。これら2つはどちらも大規模モデルの事前トレーニングに使用され、B200は「カードが手に入りにくい」です。

タイムラインを遡ると、2024年4月、黄仁勋とオタマ(Sam Altman)、OpenAI共同創設者ブロックマン(Greg Brockman)のツーショットがTwitterで流出した。この写真の背後にはH200の初期製品の重要な納品の節目があり、NVIDIAのCEO黄仁勋が直接配達を行い、OpenAIがH200の最初のユーザーとなった。

短い5ヶ月後、大洋の向こうからH200の供給情報が届きました。現在、国内ではすでに供給業者が毎週100台のH200サーバーを供給する能力を持っています。この供給業者によると、H100の生産中止に伴い、市場の需要がH200に急速に移行しており、現在H200の供給を掌握している業者は10社を超えておらず、供給と需要のギャップがさらに広がっています。

「今、市場で最も不足しているのはH200であり、私の知る限り、最近あるクラウド企業があちこちでH200を探している。」と、算力業界で18年の経験を持つベテランプレイヤーが虎嗅に語った。彼らは長年、百度、アリババ、テンセント、バイトダンスに算力サービスを提供している。

このコンピューティングパワーの軍拡競争では、トランザクションチェーンは謎に包まれています。 国内の大手コンピューティングパワーサプライヤによると、業界で一般的なコンピューティングパワーの価格設定ルールは、コンピューティングパワーユニット「P」のみがコントラクトにマークされており、これによりサーバートランザクションが抽象的なコンピューティングパワートランザクションに変換されます。 例えば、計算能力の利用者と計算電力供給者が計算電力の取引を行う場合、カードモデルは直接契約に書き込まれるのではなく、代わりにPをどれだけ使用するかという計算能力、つまり特定のカードモデルが明るい面で書かれることはありません。

産業チェーンの底に深く入り込むと、隠された取引ネットワークが浮かび上がりました。 以前、一部の中国のディストリビューターが、多層再販とパッケージングを通じて特別な調達チャネルを通じてサーバーの「カーブリスト」を達成したことがメディアによって開示されました。 Tiger Sniffはさらに、一部のディーラーがサードパーティ企業の助けを借りてモジュールを製品に埋め込むことにより、サーバーを取得する別の方法を見つけたことを学びました。

暗流が渦巻く産業チェーンの背後で、国内の計算力産業の発展も新しい方向を示しています。

01知能計算のバブルはどこから来たのか?

2023年末、海の向こうからの「NVIDIA禁止令」は、静かな湖面に投げ込まれた巨石のように、算力の核心資源を巡る暗闘が始まった。

最初の数ヶ月で、市場は原始的な混乱と落ち着きのなさを示しました。 莫大な利益の誘惑の下で、鋭い嗅覚を持つ一部の個人はリスクを冒し始めました。 「当時、市場には、海外から帰国した留学生から情報通の個人まで、あらゆるバックグラウンドを持つ『サプライヤー』があふれていました」と、ある業界関係者は振り返りますが、彼は名前を明かしたくありませんでした。 ”

これらの初期の「開拓者」たちは、情報の不均衡やさまざまな非公式なルートを利用して、NVIDIAの高性能GPUを市場に供給しました。その結果、GPUの価格は自然と高騰しました。一部のメディアの報道によると、彼らの中には、個人の供給業者がNVIDIAのA100 GPUを128,000元に設定している者もおり、公式の推奨小売価格約10,000ドルを大きく上回っています。さらに、ある人はソーシャルメディアプラットフォームでH100チップを手に持ち、1枚の価格が250,000元に達すると主張しています。当時、これらの行動や態度はほぼ自慢に近いものでした。

このような隠れた流通の下で、一部の大規模な計算力供給者はすでに類似の取引ネットワークチャネルを持つようになり、それによって引き起こされたスマートコンピューティングの熱潮も同時期に興起しています。2022年から2024年の間に、多くの地域でスマートコンピューティングセンターの建設が急ピッチで進められています。データによると、2024年だけでスマートコンピューティングセンターのプロジェクトは458件を超えています。

しかし、この盛大な「カード炒めと知能計算の熱潮」は長続きしませんでした。2024年末には、特にDeepSeekなどの国産大モデルがその高コストパフォーマンスで登場した後、一部の単純に「カード貯蔵」に依存するか、核心技術の支えが欠如している計算力供給者は、自分たちの物語を語ることがますます難しくなっていることに気づきました。知能計算のバブルも、徐々に破裂の兆しを見せ始めています。

データ統計によると、2025年第1四半期に中国本土で165のスマートコンピューティングセンターのプロジェクトが新たな動向を示し、そのうち58%(95件)のプロジェクトは依然として承認済みまたは準備中の状態にあり、33%(54件)は建設中または稼働予定の状態であり、実際に稼働または試運転を実現したのはわずか16件で、割合は10%未満です。

もちろん、バブル崩壊の兆候を示しているのは国内だけではありません。ここ半年間、MetaやMicrosoftなどが一部のグローバルデータセンタープロジェクトの停止を伝えています。バブルのもう一つの側面は、懸念される非効率と遊休です。

業界の人々は虎嗅に対して、「現在、スマートコンピューティングセンターの点灯率は50%未満であり、国産チップは性能の短所から、事前学習に全く使用できません。また、いくつかのスマートコンピューティングセンターでは、相対的に遅れたサーバーが使用されています。」

この「カードが使えない」という現象は、業界関係者によって「構造的ミスマッチ」と総括されています。これは、絶対的な計算能力の過剰ではなく、高度な需要を満たす有効な計算能力の供給が不足しているためであり、同時に既に構築された計算リソースの多くが技術的な遅れやエコシステムの不完全さ、または運営能力の不足により十分に活用されていないためです。

しかし、喧騒と不安が共存する知能計算の地図上で、テクノロジーの巨人たちはまったく異なる姿勢を示しています。

報道によると、バイトダンスは2025年にAIインフラに123億ドル(約892億元)以上を投資する計画であり、そのうち400億元の予算は中国でAIチップを購入するために使用され、さらに約500億元はNVIDIAのチップ購入に計画されている。これに対し、バイト側は虎嗅に対して、情報は不正確であると応じた。

同様にAI分野に大規模な投資を行っているのはアリババです。CEOの呉泳銘は2月24日に公開で、今後3年間でアリババがAIインフラの構築に3800億元を投資することを発表しました。この数字は過去10年間の総和を上回っています。

しかし、大規模な購入に直面して供給側の圧力も顕在化している。「市場の供給は大手の需要に追いつかず、多くの会社が契約しても納品できない。」とあるAI計算の供給業者の営業担当者が虎嗅に語った。

対比すると、上述の知能計算バブルと現在の大手企業によるAIインフラへの大規模な投資は、明らかな対照を成しているようです。一方ではA株をリードとする計算力供給者が大型知能計算プロジェクトを次々と中止しているのに対し、もう一方では大手企業が積極的にAIインフラに投資しています。

その背後の理由は理解するのは難しくありません。なぜなら、知能計算の急激な冷却のタイミングがDeepSeekの前後にぴったりと重なったからです。今年に入ってからは、「百モデル対決」に関連する概念を提起する人はいなくなりました。DeepSeekが明らかにしたのは、トレーニング需要のバブルです。今、テーブルに残っているのは大手企業といくつかのAIモデル会社だけです。

この点について、Changlei CapitalのマネージングパートナーであるFeng Bo氏もTiger Sniffに「トレーニングが花でいっぱいでないとき、本当にトレーニングする能力と資格を持っている人は、AliやByteなどのトレーニング用のカードを購入し続け、トレーニングできない人は散らばり、これらの人々の手にある計算能力はバブルになります。」 ”

02退去された算力

あらゆる「バブル」の誕生は、人間の希少性に対する非合理的な想像に根ざしています。マオタイを投機したり、計算力を蓄えたりする人々は、マオタイの愛好者や計算力の消費者ではなく、皆が投機的な心理を共有しています。

2024年末まで、2025年第1四半期に、飛利信、蓮花控股、錦鶏股份などの多くの企業が数億元の計算力レンタル契約を相次いで終了しました。一方、計算力供給者は虎嗅に対して、「計算力レンタルのビジネスでは、契約の解約はよくあることです。」と話しました。

これらのリース終了企業は、実際の計算能力需要の端末ではありません。DeepSeekによって引き起こされた業界の混乱とともに、AI業界のバブルが徐々に崩壊し、多くの計算能力供給者は計算能力の過剰という問題に直面せざるを得ず、安定した顧客を求めて四方八方に探し、新しい計算能力の消費ルートを模索しています。

調査で、Tiger Sniffは、インテリジェントコンピューティングとクラウドコンピューティングの分野の3つの企業に加えて、コンピューティングパワープロバイダーの創設者の名刺にも投資会社が印刷されていることを発見しました。 さらに掘り下げると、投資会社の投資プロジェクトは、ロボット工学会社と、大規模モデルとクラウドシステムの研究開発に注力している会社をカバーしていることがわかりました。 創設者はTiger Sniffに、「これら2つの投資会社のすべてのコンピューティングパワーニーズは、独自のコンピューティング電源システムによって満たされています。 さらに、ポートフォリオ企業は通常、独自のコンピューティングパワーを市場価格で購入します。 “

実際、知能計算産業では、知能計算+投資の結びつきの形は決して孤立した例ではありません。多くの計算力供給者にとって、「これは現在、消費カードを非常に便利に使う方法ですが、まだ表に出されていないだけです。」と冯博は虎嗅に述べました。

しかし、上記のストーリーでは、これは「独占的」な計算力消費パスであり、計算力供給者が投資を通じて計算力の需要をロックし、投資したプロジェクトの全ての計算力の需要を直接満たします。しかし、これだけではありません。

冯博は、もう一つのモデルとして、「算力供給者がLPの立場から産業ファンドに参入し、閉じた形の算力需要チェーンを構築するモデルに注目する価値がある」と考えています。

具体的には、このビジネスモデルは資本連動の特徴を示しています:算力供給者Aは潜在的な有限責任組合員(LP)として、産業ファンドBと協力の意向を結びます。Bファンドの投資マップにおいて、AIアプリケーションプロバイダーCは投資対象企業として、そのビジネスの発展は算力資源に対して硬直した需要を持っています。この時、Aは戦略的にBファンドに投資することで、C社の将来の算力調達ニーズを間接的に束縛し、「資本投入 - 算力調達」のクローズドループを構築します。

取引が成立した場合、A社はLPの地位を持って優先サービス権を得て、C社の算力調達の第一選択のサプライヤーとなります。このモデルは本質的に資金の循環流動を形成します——A社がファンドBに出資し、最終的にC社の算力調達を通じて回収されます。

!

「これは主流の方法ではありませんが、比較的使いやすい方法です。」冯博は率直に述べました。

03バブルがもうすぐ崩壊します、それからどうしますか?

「AI計算のバブルについて語るとき、計算能力だけを語るわけにはいかない。それは産業チェーンの問題であり、計算能力を活用するためには、断たれた点をつなげる必要がある。現在、この産業チェーンはまだクローズドループを形成していない。」と、業界で長年活躍している計算能力供給者の最高マーケティング責任者が虎嗅に対して、現在のAI計算産業の核心的な問題を鋭く指摘した。

2025年上半期に入ると、AI分野での顕著なトレンドは、かつては多くのAI企業が口にしていた「プレトレーニング」という言葉の熱度が徐々に「推論」に取って代わられていることです。広範なC向け消費市場に向けて、または千の業界にエンパワーメントを提供するB向け企業アプリケーションにおいて、推論の需要の成長曲線は異常に急峻に見えます。

「例えば、DoubaoやDeepSeekなど、現在の市場における主流のAIアプリケーションの量に基づくと、各アクティブユーザーが1日平均10枚の画像を生成すると仮定すると、その背後にあるコンピューティングパワーの需要は簡単に100万ペタバイトのレベルに達する可能性があります。」 これは画像生成の 1 つのシーンにすぎず、テキスト、音声、ビデオなどのマルチモーダル インタラクションが超えられない場合です。 ”

これはまだC端ユーザーの推論ニーズにすぎません。B端ユーザーにとっては、推論ニーズはさらに膨大です。華锐智算のある幹部が虎嗅に語ったところによると、自動車メーカーが知能計算センターを構築するのは万P規模から始まるとのことです。「しかも、私たちの顧客の中で大手を除けば、最も計算能力が必要なのは自動車メーカーです。」

しかし、大量の推論需要と計算能力のバブルを結びつけると、話は非常に不条理に思えます。なぜこれほど多くの推論需要が計算能力のバブルを生み出すのでしょうか?

ある計算力供給者は虎嗅に対して、このような膨大な推論需要には、知能計算サービスプロバイダーがエンジニアリング技術を通じて計算力を最適化する必要があると述べています。例えば、スタート時間の短縮、ストレージ量の増加、推論遅延の短縮、スループットと推論精度の向上などです。

さらに、前述の需給ミスマッチの問題には、大部分がチップの問題から来ている。これについて、業界の関係者が虎嗅に対して、一部の国産カードとNVIDIAの間にはまだ大きな差があり、それらの性能の発展は均一ではなく、同じブランドでもいくらカードの短所を積み重ねても依然として存在するため、単一のクラスターではAIのトレーニングと推論を効果的に完了することができない。

この「短板効果」は、大規模にチップを積み重ねて計算能力クラスターを構築しても、短板の問題が効果的に解決されない限り、全体のクラスターの総合的な性能が依然として制約を受け、AIの大規模モデルの複雑なトレーニングや大規模な推論タスクを効率的に支えることが難しいことを意味します。

実際、計算力の側面での工学的な課題やチップのボトルネックは確かに厳しいですが、多くの深層な計算力の需要が効果的に満たされていません。その真の「断点」はしばしば計算力層の上にあるアプリケーションエコシステムに現れ、特にL2層(特定の業界やシーンに対する)垂直モデルの深刻なギャップがあります。

医療産業には、埋めるべき巨大な「穴」が存在しています。人材の虹吸効果は、国内の医療システムにおいて長年批判されている構造的な問題です。優秀な医師は、一線都市の三甲病院に集中しています。しかし、業界が医療の大モデルに期待して質の高い医療資源の分散を実現しようとする中で、より根本的な課題が浮上しています:信頼できる医療データ空間をどのように構築するか?

全病程診療能力を持つ垂直型大モデルを訓練したいと考えているため、データが重要な前提となります。しかし問題は、全病程、全年齢層、全性別、全地域の膨大なデータがなければ、大モデルに知識を形成することができないということです。現実には、医療データのオープン率は5%未満です。

ある大手病院の情報科の主任が明らかにしたところによれば、その病院が毎年生成する500TBの診療データの中で、実際にAIトレーニングに使用できる匿名化された構造化データは3%未満である。さらに厳しいことに、疾病マップの80%の価値を占める希少疾患や慢性疾患のデータは、その敏感性のために長い間、各医療機関の「データ孤島」に眠り続けている。

このような断点が解決できない場合、産業チェーンは閉ループを形成することができません。計算力の需要は自然に満たされなくなり、明らかに、これは単に「カードと電力」を提供する計算力インフラストラクチャーの供給者が独自に対処できる範囲をはるかに超えています。

しかし、現在、市場には新しいタイプの知能計算サービスプロバイダーが静かに台頭しています。これらの企業は、自身のポジショニングを単純なハードウェア提供や計算力レンタルに限定することなく、専門のアルゴリズムチームや業界専門家チームを組織し、顧客のAIアプリケーション開発と最適化プロセスに深く関与しています。

一方で、さまざまなリソースの不均衡や計算力の利用率などの問題に直面し、各地では実際に地域の産業ニーズに基づいてさまざまな計算力補助政策を導入しています。その中で、「計算力クーポン」は企業の計算力コストを直接的に軽減する補助方式の一つです。しかし、現在の中国のスマート計算産業にとって、単純な政策の「応急処置」では根本的に状況を改善するのは難しいでしょう。

現在、知能計算産業に必要なのは「造血式」の育成エコシステムです。

原文表示
内容は参考用であり、勧誘やオファーではありません。 投資、税務、または法律に関するアドバイスは提供されません。 リスク開示の詳細については、免責事項 を参照してください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)