GPU価格がなぜ制御不能な上昇を続けているのか?

GPU 不足——レンタル供給の拡大——H100 の 1 年レンタル価格指数をローンチ

原著者:Daniel Nishball、Jordan Nanos、Cheang Kang Wen ほか 翻訳:Peggy、BlockBeats

原著者:律動BlockBeats

原文の出所:

転載:火星财经

編集者注:AI が「ツール」から「ワークフロー基盤インフラ」へと移行するにつれ、GPU レンタル価格は急速な上昇局面に入り、供給は継続してタイト化しています。

H100 の 1 年物価格が約 40% 上昇したことから、演算能力が 2026 年下半期まで前倒しで確保されたこと、さらに AI ラボが長期契約と更新メカニズムを通じて供給を継続的にロックしていることまで、GPU 市場の運用ロジックは明らかに変化しています。価格はもはや主にハードウェアコストによって決まるのではなく、token の消費、モデルの能力、生産効率が相互に形作るものとなっています。

需要側の変化がとりわけ重要です。マルチエージェントシステム、ネイティブコンテンツ生成、AI プログラミングツールなどの新しいパラダイムが、token 利用を指数関数的な成長ゾーンへ押し上げています。レポートの中核判断も次第に明確になってきました。AI ツールの投資対効果はすでに検証済みであり、5〜10 倍のリターンにより、算力価格がかなり長期にわたり需要に対して有効な制約をかけにくい、ということです。

この結果生じる緊張感はますますはっきりしています。現実の算力市場は全面的な逼迫と価格決定権の上方移転を示す一方で、資本市場は依然として「いずれ過剰になり、商品化する」という期待のままです。この期待と現実のずれが、AI インフラ分野のバリュエーションロジックを再形成しています。

算力が新たな生産資材になると、その価格メカニズム、供給構造、そして資本回収が、いま一度の深層的な再構築の局面に入っています。

以下、原文:

Anthropic の Claude 4.6 Opus と Claude Code の需要が大幅に急増しています。同社の年間経常収益(ARR)は、たった 1 四半期の間に、昨年末の 90 億ドルから現在の 250 億ドル以上へと跳ね上がり、ほぼ 3 倍の成長を実現しています。同時に、GLM や Kimi K2.5 を代表とするオープンソースモデルも、オープンソースモデル関連アプリケーションの急速な拡大を後押ししています。Anthropic、OpenAI、そして複数の Neolabs を含む企業が継続的に資金調達を行っており、それもまた GPU リソース需要の増加を加速させています。

この転換点は、短期間で需要が急激に上昇し、超大規模クラウド事業者(hyperscalers)と新興クラウドサービス事業者(Neoclouds)に GPU の買い占めラッシュが発生したことを意味します。

この新たな需要は、サプライチェーン全体に沿って価格を押し上げています。DRAM と NAND のストレージから、光ファイバーケーブル、データセンターのホスティング、さらにガスタービンなどのインフラに至るまで、関連するほぼすべての製品とサービスで値上がりが発生しています。

GPU レンタル価格は、算力関連の多くの製品・サービスの中で、最新の「供給逼迫」と「価格急騰」が起きている領域となっています。H100 の 1 年物 GPU レンタル契約価格は、2025 年 10 月の 1 GPU あたり 1 時間 1.70 ドルの安値から、2026 年 3 月の 2.35 ドルへ上昇しており、上昇率は約 40% に達します。

オンデマンド(on-demand)の GPU レンタル供給能力は、すべてのモデルでほぼ完全に売り切れています。オンデマンドのインスタンスをすでに確保しているユーザーは、価格上昇後でも算力を市場に戻す意思がありません。2026 年の年初には、GPU 算力を探す難しさが、まるで「最終便の飛行機のチケット」を奪い合うような状態になっています。価格は高騰し、ほとんど席がありません。より適切な例えを使うなら、「チケットを取る」というより「ルートを探して薬を買う」ようなものです。

SemiAnalysis では、Neocloud と超大規模クラウドエコシステム内のさまざまなトレンドや重要テーマを長期にわたり深く追跡しており、その中には GPU レンタル価格も含まれています。この能力は、ClusterMAX、InferenceX、そして AI クラウド総保有コスト(TCO)などのプロジェクトにおける継続的な研究と実践に由来します。

一方で私たちは、さまざまな AI ラボが Neocloud サービス提供者にアクセスし、市場で GPU レンタルのリソースを探せるように尽力してきました。そしてエコシステム内のほぼすべての参加者と、GPU レンタル価格の変化傾向について継続的に意見交換を行っています。

2023 年以来、私たちは顧客向けに GPU レンタル価格の指数体系を構築・維持しており、H100、H200、B200、B300、GB200、GB300、MI300、MI325、MI355 などの主要 GPU モデルをカバーし、さらに異なるレンタル期限にまたがって、オンデマンド(on-demand)、1 カ月の短期レンタルから最長 5 年の長期契約まで含めています。この指数は、複数の Neocloud サービス提供者と算力の購入者への調査データに基づいて構築され、実取引データ、ならびに私たちが参加して行った仲介の交渉・成約状況によってクロス検証されています。

本日、私たちは H100 の 1 年物 GPU レンタル価格指数を一般公開します。業界に対し、より多くのデータと洞察を提供したいと考えています。この指数は月次で更新され、X と LinkedIn を通じても最新のトレンド解説と市場観察を継続的に発信します。なお、異なるレンタル期限の構造やその他の主要 GPU モデルの完全な価格データについては、現在のところ、私たちの AI クラウド TCO モデルを購読している機関ユーザーのみが利用可能です。

本レポートは、GPU レンタル市場の最新トレンド、市場フロントラインの観察、そして重要データを中心に展開し、私たちが市場全体の構造をどう理解しているかを解説するとともに、将来のレンタル価格の方向性について初期の判断を示します。

GPU レンタル市場が「ダイナミックプライシング(動的価格設定)」段階へ

H100 の 1 年物レンタル価格カーブだけを見ると、市場の逼迫度合いを完全には表せません。私たちがフロントラインで算力を実際に調達した経験や、市場参加者からのフィードバックが反映している状況のほうが、より厳しいからです。

現在の需要は複数の高度に異質な利用シナリオから来ており、「万能の解法」はほとんど存在しません。例えば推論側では、大規模ミックスド・エキスパート(MoE)モデルは GB300 NVL72 のような最新の大規模システムで実行するのにより適しています。一方、学習側では H100 がコストパフォーマンスの面で依然優位であるため、「相対的に旧世代」の GPU であっても需要は高止まりしています。

顧客は今、1 GPU あたり 1 時間 14 ドルという AWS p6-b200 のスポット(抢占式)インスタンス価格を競って支払う状況にあります。いくつかのトップクラスの Neocloud サービス提供者は、もはや単一ノードの販売をやめているところもあります。さらに、一部の H100 の更新(リニューアル)価格は、なんと 2〜3 年前に契約したときとまったく同じです。加えて、ある種の H100 契約はそのまま 2028 年まで更新されており、レンタル期間は 4 年に及びます。いま 8 ノード(64 枚の GPU)であっても、H100 または H200 のクラスターを見つけるのは簡単ではありません。私たちが問い合わせたサービス提供者の半分はすでに完全に売り切れになっており、多くのサービス提供者の返答は「近い将来、Hopper アーキテクチャの GPU が契約満了で放出される予定はそもそもない」というものです。

私たちは、算力の借り手の一部が、自分たちが借りているクラスターをさらに解体して再レンタル(転貸)し始めた、という話も聞いています。まるでモナコ・グランプリ期間中にアパートを分割して短期貸し出しするかのようです。次は、いわゆる「Neocloud 二次仲介(ダブルトレーダー)」が登場するのかもしれませんが、それももはや冗談ではないでしょう。

Blackwell の供給も同様に極めて逼迫しています。私たちが把握したところによると、オープンソースの重み(ウェイト)モデルへの需要が強く、かつ推論需要が持続的に爆発しているため、新しい Blackwell クラスターの導入・納品リードタイムは現在、6 月から 7 月まで延びています。さらに、これから稼働予定のそれらのクラスターの多くも、すでに事前にロックされています。実際、マーケット全体を見ると、2026 年 8 月から 9 月に新規で稼働開始する供給分でさえ、ほぼすべてが予約で埋まっています。

GPU レンタル価格:巻き返し再来

では、市場はいかにしてここまでの状況になったのでしょうか。振り返ると、6 か月前にはほとんどの市場観測者が GPU の「終価(終わりの価値)」に懐疑的であり、GPU レンタル価格は時間の経過とともに不可避的に下落し続けるだろう、という見方が一般的でした。そのとき、もし Neocloud や超大規模クラウド事業者が財務モデルで GPU 算力資産を 6 年の減価償却サイクルで処理していたなら、金融アナリストから批判を受けていた可能性さえあります。将来のトレンドを議論する前に、どのようにここまで展開してきたかをまず簡単に振り返ります。

2025 年下半期以前、エコシステム全体の主流な見通しは次の通りでした。Blackwell の大規模展開が進み、その単位算力コストが大幅に低下することで、Hopper(すなわち H100 と H200)のレンタル価格は明確に下落するはず、というものです。しかし実際はその真逆でした。2025 年下半期に入ると、H100 の需要は弱まらず、むしろ多くのシナリオでさらに強まりました。オープンソースの重みモデルの急速な普及と、その時点での推論需要の継続的な加速が、このほぼ終わりのない算力需要の波の最初のシグナルでした。

2026 年 1 月になると、算力市場は次の転換点を迎えます。DRAM と NAND のストレージ価格が、数四半期にわたる急上昇を経た後、ほぼ「放物線のような」急騰フェーズへ入ったのです。私たちのストレージモデルによれば、2026 年第 1 四半期において、LPDDR5 と DDR5 の契約価格の前年比上昇率は、それぞれ約 4 倍と 5 倍に迫っています。

部品コストの急激な上昇がもたらす利益率リスクに対応するため、OEM メーカーは AI サーバーの販売価格を引き上げ始めました。しかも値上げ幅は、下層の部品コストそのものの値上げ幅を明確に上回っています。これにより、クラスタの資本支出(CAPEX)に関する意思決定はさらに複雑になりました。サーバーの購入コストが高くなることで、プロジェクトの見込みリターンが圧縮され、一部の運用者は展開スケジュールを遅らせたり、場合によってはそもそもプロジェクト自体を見送ったりすることになりました。その結果、本来なら稼働し得た一部の新規供給が延期または保留となり、レンタル市場の逼迫状況はさらに悪化しました。

「AI サーバーの価格が制御不能に陥った」ことによる調達の混乱の中で、GPU レンタル需要は大きく加速しました。市場に当初残っていた算力は、1 月と 2 月の時点でほぼ完全に消化されました。3 月になると、H100、H200、B200 のいずれも、ほぼどのレンタル期間でも利用可能な供給を見つけることができなくなりました。1 年物レンタル価格は 1 月末に 1 GPU あたり 1 時間 2 ドルを超え、さらに 2 月中下旬には 1 月末から再度 15%〜20% 上昇しました。3 月末には、前月比でさらに 15%〜20% 上昇すると見込まれています。

今年初めの需要の重要なドライバーの一つは、ネイティブメディア生成(native media generation)です。Seedance や Nano Banana のようなアプリは、ユーザーが大規模に画像や動画を生成・反復できるようにし、それにより token のスループットを大幅に引き上げています。しかし、さらに重要で、より目に見える需要源はマルチエージェント(multi-agent)ワークロードの台頭です。これらのシステムは複数ステップのプロセスを実行し、高い並列性の環境でも継続的に反復するため、token 消費と算力需要が「指数関数的」に増えていきます。

このトレンドは、Claude Code に関する関連データでも特に顕著に表れています。私たちはこれまで複数の記事で触れてきました。例えば SemiAnalysis の場合、直近 7 日間だけでも社内で数十億 token を消費し、平均コストは 100 万 token あたり約 5 ドルです。しかしそれにより得られる時間の節約、ワークフローの拡張、能力の向上は、コストそのものをはるかに上回ります。現在 SemiAnalysis は、一連の AI ツールを複数のワークフローに埋め込んでおり、単なる検索や要約にとどまらず、データダッシュボード、オートメーションによる大規模なデータ取得、大規模データ処理、そしてエージェントに基づく金融モデリングなどのシナリオにも広げています。

また、Claude 毎日の提出量(Claude Commits Daily)などの指標を通じて、この需要の爆発的な増加を追跡しています。現在の傾向が続くと、私たちは 2026 年末までに Claude Code が全コード提出量の 20% 以上を占めると見込んでいます。言い換えると、あなたがまだ気づかないうちに AI はすでにソフトウェア開発の全プロセスを「飲み込もう」としています。このデータセットを入手したい機関顧客の方は、私たちの API チームにご連絡ください。先に少しだけ明かすと、この提出量は、私たちが最初に公開した時点の水準をすでにはっきり上回っています。

私たちの界隈では、ほぼ全員が Claude Code のヘビーユーザーです。しかし同時に、その界隈自体が AI と半導体の領域に深く没頭している「最前線のほんの一部の人々」にすぎないことも理解しています。

多くの《Fortune》500 企業、そしてより広い一般の人々にとって、Claude Code と「エージェントの世界」は、ほんの少し新奇な周辺トピックにすぎず、Facebook のフィードや NPR のポッドキャストで時折見かける程度です。彼らは、エージェントに駆動された生産性の波と構造的インパクトが、迫ってきていることをほとんどまだ認識していません。

実体経済側から参加者が次第に、AI ツールがもたらす驚異的な投資回収(ROI)に気づき、そしてこの「算力の波」に参加するにつれて、token 消費は階段状に上昇し続けるでしょう。AI の投資対効果に関する議論は、実際にはすでに決着がついています。AI ツールが生み出す価値は、そのコストの 1 桁以上上回ることが多いのです。こうした背景のもとでは、token 需要のカーブが右にシフトし続けており、強力で(現段階では)相対的に弾力性の低い力が形成され、GPU レンタル価格のさらなる上昇を押し上げています。

簡単に言えば、AI ツールの投資回収が 5〜10 倍に達するなら、GPU レンタル価格にはまだ非常に大きな上振れ余地があり、そうして初めて需要に対して本当に抑制がかかる可能性があります。さらに、レンタル価格がこれ以上上がり続け、それが上流へ波及してサーバーや主要なコア部品のコストも押し上げることも私たちは否定しません。

SemiAnalysis H100 1 年物レンタル価格指数を公開

本日、私たちは SemiAnalysis の H100 1 年物レンタル契約価格指数を無料で一般公開します。目的は、市場に対して GPU レンタル価格のトレンドに関する認知と透明性を高めることです。

この指数は、100 社以上の市場参加者(Neocloud サービス提供者、算力の購入者、販売者を含む)の月次調査データに基づいて構築し、GPU レンタル価格の代表的レンジ(第 25〜第 75 パーセンタイル)を特定するために用います。同時に、実取引データでクロス検証も行い、自社のネットワーク内で売り手と買い手をマッチングし、一定の取引にも直接関与することで、価格水準をさらに調整(キャリブレーション)します。

2023 年以来、私たちは H100、H200、B200、B300、GB200、GB300 を含む GPU を継続的に追跡し、3 か月から 5 年までのさまざまなレンタル期間における契約価格を対象にしています。また AMD 系(MI300、MI325、MI355)に関するデータも取り入れています。

市場で既に存在する GPU 指数と比べたとき、SemiAnalysis の H100 1 年物契約価格指数にはいくつかの重要な違いがあります:

まず、多くの GPU レンタル指数はスポット/オンデマンド(spot/on-demand)の見積もり価格、あるいは公開の掲示価格に基づいています。しかし実際には、GPU レンタル取引の大半は長期契約で行われており、通常は 6 か月以上の期限です。これらの価格は両者間の交渉で形成され、いかなる公開データベースにも現れません。多くの大手 Neocloud サービス提供者は、少なくとも 1 年のレンタル契約を結ぶことを好み、2〜3 年がより理想的で、さらに 5 年の大型パッケージ契約が結べればなお良い、というのが一般的です。SemiAnalysis の H100 1 年物レンタル指数は、まさにこの「契約市場」、つまり実取引量が最も集中している領域に焦点を当てています。特定のレンタル期間を明確に指定しているため、この指数はユーザーにとってカバーしている市場レンジを理解しやすく、自身の観察と照合もしやすいのです。

次に、公開されている価格は、実際の成約価格をそのまま表すものではありません。超大規模クラウド事業者や Neocloud が公表する価格は、より多くの場合、トレンドの方向性に関する参考であり、実際の取引水準ではありません。これらの価格は契約市場の変化より遅れており、通常は算力需要がすでに変化した後に調整されます。特にオンデマンド市場では、価格が比較的固定の水準に設定されがちです。一方で実際の需給変化は、稼働率やリソース占有率を通じて反映され、必要なときに限って不定期に調整が入ります。この市場メカニズムについては、記事の後半でさらに詳しく掘り下げます。

さらに、市場には大規模な見積もり・価格・取引データを扱い、トレンド分析で優位性を持つ指数もありますが、私たちのアプローチは市場参加者との直接的な関わりをより重視しています。各見積もりや各取引には、その固有の文脈と意思決定ロジックがあります。私たちは定量データを提示するだけでなく、定性情報や一線の観察も補うことで、GPU レンタル市場の実際の構造をより包括的に再現したいと考えています。

機関購読ユーザー向けには、ほぼすべての主要な GPU レンタル市場をカバーする完全な期限構造データも提供します。

H100 1 年物契約価格指数の公開とあわせて、機関向け Tokenomics モデル購読ユーザーには SemiAnalysis Tokenomics Dashboard も提供します。最先端の AI モデルの状況を追跡し理解するためのものです。このダッシュボードでは、コード、推論、数学、エージェント評価など複数の次元でユーザーがカスタム比較でき、さまざまなモデルやサービス提供者の API の価格設定を比較し、主要な AI ラボが開示している重要データ(token 利用量、収益、バリュエーション、顧客規模など)を確認できます。

GPU レンタル市場の現在の構造

2025 年下半期以前は、GPU レンタル市場の価格環境は比較的競争的でした。当時は、運用者が持つ GPU 在庫がより充実しており、端末側の需要がようやく加速し始めた段階でした。したがって、各 Neocloud サービス提供者は激しく競争し、顧客を獲得するためにより魅力的な価格で争うことが一般的でした。彼らの中核目標は、稼働率を高め、次の GPU イテレーション(更新)サイクルが到来するまでに、既存の算力資産の価値をできるだけ「絞り出す」ことでした。

しかしその後、市場の構図は 180 度転換しました。現在、Neocloud と超大規模クラウド事業者はすでに完全に主導権を握っています。彼らはより高い前払い金、より有利な価格、より長い契約期間を要求できるだけでなく、契約の開始・終了時期も自ら選択して、自社の在庫と生産能力の計画に合わせられます。同時に、時間も供給側の味方になっています。彼らは自分たちのペースでデプロイを進め、上昇し続ける価格環境の中で、徐々に最も質の高い顧客構成を選別できるのです。

構造的に見れば、GPU レンタル市場は大きく 3 つの区分に分けられ、それぞれが異なるタイプの顧客需要に対応しています:

短期レンタル:オンデマンド(on-demand)、スポット(抢占式)および 3 か月以内の契約

中期契約:3 か月から 3 年以上の契約

長期パッケージ(offtake):4〜5 年の契約で、5 年が最も一般的

短期レンタル:オンデマンド、スポット、3 か月以内の契約

短期レンタルはレンタル期間構造の先頭に位置しており、多くの場合「残存供給(残余キャパ)」に相当します。しかし一部のサービス提供者(Runpod、Lambda など)は、規模が一定以上で、柔軟なオンデマンドまたはスポット算力の提供に特化しています。

注意すべきなのは、オンデマンド市場の価格メカニズムが、他の契約市場と大きく異なることです。通常、サービス提供者はオンデマンド資源に対して比較的固定の価格水準を設定し、調整は極めて稀にしか行いません。言い換えると、短期市場の価格はリアルタイムの需給だけで直接駆動されるのではなく、より多くの場合、リソース利用率の変化によって示されるということです。

サービス提供者は通常、リソース利用率に応じて価格を一度だけ調整します。利用率が低いときは需要を刺激するために値下げし、利用率がほぼ満載に近づくと、需要がより高い価格水準でも高止まりできるため、価格を引き上げます。

これが、時系列で見ると Neocloud が公表するオンデマンド価格が長い期間ほぼ変わらず、その後突然「跳躍的」に上昇または下落することが多い理由を説明しています。オンデマンド市場において、需要の変化を高頻度に反映できるのは価格ではなく、リソース利用率です。

中期契約(Mid-Term Contracts)

経済的な意味でより重要なのは「契約市場」です。なぜなら、GPU レンタルの取引価値の大半がこの領域で発生するからです。とりわけ 1 年物契約は特に重要で、それは AI ラボではない顧客の限界需要を反映し、大口顧客からのあふれ需要(オーバーフロー需要)も示すため、市場の引き締まり度合いを最も敏感に判断できる指標です。

AI ネイティブ(AI Natives)や中小規模の AI ラボは、主に 1〜3 年物のレンジで活動しています。しかし最近の明確なトレンドとして、これらの機関もより長期の契約で算力資源を確保しようとする動きが見られます。多くはすでに 4 年以上に延びており、前払いが 20% 以上になることをいとわないケースも少なくありません。これは、過去 4 年以上の契約ではあまり一般的ではありませんでした。

長期パッケージ(Long-Term Offtakes)

さらに長い 4〜5 年物市場では、大型の AI ラボが主な勢力になります。これらは早い段階で大規模な算力資源をロックします。この種の取引は通常、50MW、100MW、あるいはそれ以上の規模のクラスターに対応し、おおよそ 2.4 万〜4.8 万枚の GB300 NVL72 GPU に相当します。全体として、このような長期パッケージ契約は Neocloud GPU レンタル市場の相当大きなシェアを占めています。

AI ラボがこの種の契約を好む理由は、端末側需要の急速な成長に対処するために、大規模な算力を一度にロックできるからです。同時に、これらの機関はクラスター設計にも深く関与します。ストレージ、ネットワーク、CPU の構成などの重要な要素にまで踏み込みます。この種の取引は、しばしば **裸金属(bare metal)** の形で引き渡されます。AI ラボには十分なエンジニアリング能力があり、より基盤レベルで技術スタックをカスタマイズできるため、最適な TCO(総保有コスト)と性能を実現できるからです。

Neocloud サービス提供者にとっても、この種の取引は魅力的です。1 つは、販売リソースを少数の大口注文に集中でき、大量の小規模顧客を相手にして同じ収益を得る必要がないことです。もう 1 つは、長期契約によってより有利な条件での債務ファイナンスがしやすいことです。融資の期間と契約期間を一致させることで、期限のミスマッチや価格変動リスクを効果的に低減でき、さらに多くのケースで、プロジェクト内部収益率(IRR)が十数パーセントに固定されます。

加えて、超大規模クラウド事業者(Hyperscalers)もそこに「保険役(backstop)」として入ることがよくあります。彼らは直接の購入者として Neocloud から算力を調達し、それを AI ラボに再販します。この構造は双方にとってウィンウィンです。Neocloud は AAA 格付けの購入者をもとに、より良いファイナンス条件を得られます。一方、超大規模クラウド事業者は、自社の資産負債表を拡張することなく、信用保証を提供することでプロジェクト収益の一部を得られます。

下表は、私たちが追跡しているいくつかの大型パッケージ契約を示しています。これらの取引について深掘り分析し、そこから逆算することで、暗黙の GPU 時間単価($/hr/GPU)や、プロジェクトの IRR、EBIT 利益率などの重要な収益指標を推定します。

現在の市場環境では、拡張中の大規模 AI クラスターのほとんどが、実際には AI ラボの「内部消化(in-house absorption)」によって消費されています。しかしそれらの機関は、4 年以内の契約市場に補充する形で算力を追加するための取引は行います。そして既存の H100 および H200 クラスターを更新し続けることで、供給がこの市場へ再び流入することを間接的に阻止しています。GB200 と GB300 の超大規模クラスターが徐々に稼働し始めるにつれて、1〜3 年物契約市場の需給関係がどのように変化するかは、今後重点的に観察すべき変数になります。

「ボールはどこへ転がるのか」(Where The Puck is Going)

いま最も注目すべきなのは、足元の現実(ファンダメンタル)と市場心理の間にある、はっきりしたギャップです。供給が締まり、価格が上昇していること—これらは本来 Neocloud にとって追い風(利益率拡張、資産の使用寿命延長)になるはず—にもかかわらず、公開市場は CoreWeave、Nebius、Iris Energy などの企業に対してますます悲観的になっており、株価は現在も過去 6〜12 か月のレンジ下限付近にとどまっています。

市場は依然として「最終的に供給過剰になり、算力が商品化する」という物語に支配されており、上記の変化は投資家が GPU の長期価値に抱く懸念を実際には十分に緩和していません。しかし現場の状況を見ると、供給の逼迫が続き、価格決定権が強まっていることは、ほぼすべての算力が需要によって「吸収」されていることを意味します。性能に差はあっても、こうした極端な逼迫環境では、やはり需要が供給を上回る状態です。

今後の 3 つの観察ポイント

GPU レンタル価格が今後も高止まりするのかを判断するには、次の 3 つの変数に注目できます:

1、GB300 クラスターの拡張ペース(2026 年) 新規の算力と token 需要の相対速度がポイントです。供給の逼迫が緩和するのか、それとも需要が引き続き供給を上回るのか。これが AI ラボが 4 年以内市場へ継続して参加するか、またその期間の価格動向に直接影響します。

2、半導体不足がさらに悪化するかどうか 台積電の N3 工程能力、HBM、DRAM、NAND などの重要工程のいずれかに、製造実行レベルでの変動が起きれば、供給はさらに引き締まる可能性があります。

3、AI ラボの収益(ARR)と token 消費の増加スピード AI の商用化と利用規模の拡大が、端末需要の強さを決めます。これは算力需要を駆動する中核変数でもあります。

価格は一方向に上がり、リターンもそれに伴って向上

総合すると、相対的に明確な結論はこうです。GPU レンタル価格が引き続き上昇する確率は、下落する確率より高い、ということです。

この過程には明確な自己強化の特徴があります。Neocloud が供給の逼迫と価格上昇を観測すると、より多くのハードウェアを前倒しでロックし、市場の供給をさらに圧縮することで、価格のさらなる上昇を促します。これは 2023〜2024 年の GPU 短缺サイクルに似ています。当時、供給不足が OEM による利益拡張を押し上げ、それによりサーバー価格が大きく上昇しました(ただし今回は市場の成熟度がより高いため、このプロセスが完全に同じ形で再現されるとは限りません)。

同時に、GPU レンタル価格が再び上向くことは、Neocloud の資本回収率(ROIC)も改善しています:

一方では、すでに配備された資産の利益率が向上します

もう一方では、GPU の経済的な使用サイクルが延長され、資本がより長い期間にわたってキャッシュフローを生み出せます

では、いまの最大の受益者は誰か?

現時点で最も直接的に恩恵を受けるのは、次の特徴を持つ算力提供者です:

・短周期契約が中心(すぐに再価格設定できる)

・大量の H100 の既存在庫設備を保有

・短期間で新たな供給能力が立ち上がる

短期レンタル構造の Neocloud は、古い契約をより早く解放し、高い価格で再契約することで、迅速に利益率を拡張できます。また、次世代の算力を先回りでロックする超大規模クラウド事業者(多年度契約)や Neocloud も、今後のサイクルで恩恵を受けるでしょう。

では問題です。今回は、本当に「違う」のか?

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • 人気の Gate Fun

    もっと見る
  • 時価総額:$2.24K保有者数:0
    0.00%
  • 時価総額:$2.23K保有者数:1
    0.00%
  • 時価総額:$2.24K保有者数:1
    0.00%
  • 時価総額:$0.1保有者数:0
    0.00%
  • 時価総額:$2.27K保有者数:2
    0.07%
  • ピン