算力が逼迫!英伟达が4年前にリリースしたH100のレンタル料金が、過去半年で約40%急騰

robot
概要作成中

新年以来、AnthropicやByteDanceなどのAI大手が相次いでヒットアプリを発表し、「ロブスター」ブームがオープンソースの大規模言語モデルの利用を加速させる追い風となる中、NVIDIAのH100チップはレンタル市場で時価が「V字」反転するという絶頂の瞬間を迎えています。

ご存じの通り、このチップは黄仁勋が2022年3月のGTCで発表し、同年秋から出荷を開始した製品です。

半導体調査機関SemiAnalysisが木曜日に発表した「H100の1年期レンタル契約価格指数」によれば、**この“旧世代チップ”のレンタル契約価格は2025年10月に1時間あたり1.7ドルに到達した後、今年3月には1時間あたり1枚のGPUで2.35ドルへと急騰し、上昇率は約40%**に達しています。

(出所:SemiAnalysis)

この指数は、100社以上のクラウドサービス提供者と計算資源の買い手・売り手に対する直接調査データに基づいて構築され、毎月1回収集されます。

最新レポートでは、オンデマンドでレンタルされるGPUの計算能力が、あらゆる種類のGPUの中ですでに売り切れ状態にあると指摘されています——たとえ足元で価格が上昇していても、オンデマンドのインスタンスをすでに確保している顧客は、その計算能力をリソースプールに戻すことを望んでいません。同機関は比喩として、2026年初めにGPUの計算能力を探すのは「最終便で飛び立つフライト」のチケットを予約しようとするようなものだと述べています。価格は高く、しかも利用可能なリソースはほとんどありません。

研究者はさらに、「顧客は、1枚のGPUにつき1時間14ドルの価格で、Amazon Web Servicesのp6-b200競札インスタンスを買い漁ることに躍起になっています。さらに、一部の新興クラウドサービスの巨頭(Neocloud Giants)では、すでにシングルノード販売をやめてしまっているところさえあります。一部のNVIDIA H100 GPUは、2〜3年前に締結したときの元値でまだ更新契約しており、さらに一部のH100契約は2028年までそのまま更新されているのです。」

より先進的なアーキテクチャのBlackwellチップはどうでしょうか。研究者によれば、オープンウェイトモデルに対する強い需要と、推論需要の持続的な急増により、新規にBlackwellを展開する際の納期は現在6〜7か月に延びています。

2025年後半の時点では、市場は、性能がより高く、計算コストがより低いBlackwellチップの投入が加速すれば、Hopperチップ(H100、H200)のレンタル価格が大幅に下落する可能性があると一時見込んでいました。しかし最新の状況は、その見立てとまったく逆です。現在、市場におけるH100への需要は底堅いだけでなく、多くのケースではむしろさらに強まっています。

SemiAnalysisはレポートの中で、今年初めの計算需要の重要な駆動要因の一つは、ネイティブなメディア生成であると指摘しています。例えば、ByteDanceのSeedance(すなわちDream)とGoogleのNano Bananaが、ユーザーによる大量の動画/画像生成と最適化を促すことで、トークン(token)のスループットが大幅に上昇しています。さらに顕著な需要源は、マルチエージェント(multi-agent)ワークロードの台頭であり、トークン使用量と計算消費が放物線状に増加しているとしています。

SemiAnalysisは、自社だけでも「過去1週間で数十億トークンを消費した」とし、100万トークンあたりのコストは5ドル前後だと述べています。とはいえ同社は、これにより節約できた時間と、業務フローおよび能力の拡張によって得られるリターンは、計算コストをはるかに上回ることを満足げに表明しています。

レポートはまた、計算供給が逼迫し価格が上昇するという力学と、広範な市場のセンチメントとの間にズレがあるとも指摘しています。CoreWeaveやNebiusなどの新興クラウドサービス企業の株価は、過去6〜12か月のレンジの下側に位置しています。分析によれば、現在、市場は依然として「いずれ供給過剰が起き、計算能力が商品化する」という物語の枠組みに固定されています。しかし現実は、強い供給逼迫という状況の下では、ほぼあらゆる種類の計算資源が旺盛な需要を維持する——相対的な性能の違いにかかわらず、ということです。

今後の見通しとして、研究者はGPUレンタル価格が高止まりし続けるかどうかを見極めるための3つの重要な観察ポイントを示しました。

まず、GB300クラスターが2026年を通じて段階的に出荷量を増やしていくにつれ、市場は、新規供給が果たして現在の計算能力の逼迫を緩和できるのかに注目します。次に、継続するチップ不足がさらに悪化するのかを見守る必要があります。最後に、大手AI企業の年間経常収益(ARR)の拡大状況、ならびにAIアプリの普及速度とトークン消費規模の継続的な増加ペースを観察する必要があります。

(出所:財聯社)

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン