「AI新世代」からGPUへ、LPUへ:NVIDIAが推論チップに大規模進攻、黄仁勋が再び重要な一手

robot
概要作成中

「AI新世代」GPUからLPUへ:エヌビディアが推論チップ市場へ本格攻勢、黄仁勲が再び重要な一手

3月17日未明、GTC 2026にて、エヌビディアCEOの黄仁勲が新たな武器——Groq 3 LPUを披露し、推論チップ市場へ大規模に攻め込んだ。

AI産業の風向きが変わった。ここ数年、誰もが必死に「モデルを訓練」していた——データをGPUに投入し、それが知能を育て上げるのを待つ。あの頃、エヌビディアのGPUは唯一の王で、誰も揺るがせられなかった。しかしこの2年で、スマートエージェントが群れを成して市場に押し寄せた。Manusはバズり、OpenClawは話題を席巻し、モデル企業やクラウド事業者はtokenを売って稼ぐようになり、Cerebrasらは「より速く、より安く」という旗印を掲げ、エヌビディアが長年独占してきた地図に切れ目を入れ始めた。

業界はついに気づいた。訓練は続いているが、「推論」が主流になっているのだ。エヌビディアがこの市場機会を逃すはずがない。推論というケーキもまた、一切れは自分たちの手で切る。3月17日未明、GTC 2026にて、エヌビディアCEOの黄仁勲は新たな武器——Groq 3 LPUを披露し、推論チップ市場へ大規模に攻勢をかけた。同時に彼は一連の数字も投げた。2027年末までに、BlackwellとRubinという2つの製品ラインの年間売上は1兆ドルに達し、半年ほど前の予測を倍に上回る。

訓練と推論の両輪で

今回、エヌビディアは公式にVera Rubinプラットフォームを発表し、7種類のチップを搭載する。内訳はRubin GPU、Vera CPU、ConnectX-9 SuperNIC、BlueField-4 DPU、NVLink 6 Switch、Spectrum-X 102.4T CPO、そして新たに統合されたGroq 3 LPUだ。

「LPU」の正式名称は「Language Processing Unit」、つまり言語処理ユニットで、専用のAI推論アクセラレーション・チップである。Rubin GPUはGroq LPUと組み合わせることで、現在の毎秒100トークンのスループットを、毎秒1500トークン、あるいはそれ以上へ引き上げ、AIエージェントのインタラクション・シーンを完璧に支える。

エヌビディアはさらに、新型のGroqアクセラレータを収容するための完全なラック——Groq LPX——も提供した。同社の超大規模・高性能計算担当副社長Ian Buckによれば、Groq LPXは「トークンごとにAIモデルの各層で」解読性能を向上させ、Rubinが人工知能の次なるフロンティア領域であるマルチエージェント・システムにサービスできるようにする。これらのシステムでは、推論で数兆個のパラメータを含むモデルを扱いながら、数百万トークンのコンテキスト・ウィンドウ内でインタラクティブな性能を提供する必要がある。

エヌビディアの推論チップ市場への思いは今日始まったものではなく、早くから準備していた。2025年12月に同社は、約200億ドルの価格でGroqのコア技術資産を買収し、その創業者がエヌビディアに加わった。Groq 3 LPUは、買収後に最初に公開された成果である。

ゴールドマン・サックスのグローバル投資調査部のモデル予測に基づくと、AIサーバーのAIチップにおける非GPGPUチップの出荷比率は明確に上昇する見通しで、2024年の36%から2027年には45%へ段階的に増え、一方でGPGPUチップの出荷比率は2024年の64%から2027年には55%へ段階的に低下するとされる。

InSemi Researchのシニアアナリストである秦豊偉氏が、本紙記者に対し次のように説明した。GPUは、基盤モデルの訓練におけるほか、より高い汎用性が求められるシーン(たとえばパブリッククラウド)や、並列計算のシーンでより競争力がある。これに対し、ASIC(TPU、DPU、NPU、LPUなどを含む)は、モデルのデプロイ段階、そして推論のシーンでは相対的に優位性がある。なぜならこれらのシーンは、エネルギー効率比や応答遅延などの面でより高い要求を伴うからだ。

「だからこそエヌビディアがLPUを出したのは、AI計算能力の需要が『訓練』から『推論』へ移ることに対応する戦略的配置であり、弱点を埋めるための重要な一手です。それは、より細かな製品配置で、市場の変化と競合相手の挑戦に応えているのです。」と、深度科技研究院の院長張孝榮氏は本紙記者に語った。

メディア報道によると、増え続ける推論需要へのエヌビディアの対応策が、同社にもたらしたリターンはすでに成果となっている。先月OpenAIは、エヌビディアと協議し、「専用の推論能力」を持つチップを購入することで合意したと表明した。

チップから工場までのエコシステム強化

ここ数年、生成AIが市場を爆発させ、基盤モデルの訓練は絶対的な計算力のブラックホールになった。GPUの圧倒的な主導性のおかげで、エヌビディアはこの熱狂の大半の恩恵を得て、業績も時価総額もともに急上昇し、まさに手に余るほど稼いだ。

だが、モデルのパラメータ競争が限界効用逓減のボトルネック期へ入り、大規模モデルの訓練を2年間猛走させた後、ついに減速した。2025年から、競争の軸がずれ始めた——エージェントとコンテキスト・エンジニアリングがC位に躍り出た。最も直接的なサインは、OpenClawがソーシャル・プラットフォームを攻略し、テック業界から一般の人々の情報フローへと一路ブレイクアウトし、普通の人の目に届く場所へ入り込んだことだ。

エージェントは、推論市場の需要成長を押し上げる重要な要因の一つである。その中核となるシナリオは訓練ではなく推論により重点が置かれる——この見方は複数の権威ある研究や業界分析によって明確に支持されている。したがって、AI能力が基礎となる大規模モデルの訓練段階から、ワークフロー構築に重心を置くエージェントへと進化するにつれて、AI計算力需要の重点は訓練から推論へ移っていった。

そしてAIインフラのナンバーワンプレイヤーとして、エヌビディアも市場の潮流に合わせて変わらなければならない。それもエコシステム全体のレベルでアップグレードする必要がある。

今回のGTC大会では、LPUのほかにも、OpenClawの創業者Peter Steinbergerを代表とするチームとエヌビディアが連携し、トップクラスのセキュリティおよび計算の専門家を招集して、NeMoClawの参照アーキテクチャを発表した。これは内蔵されるOpenShell技術、ネットワーク防御メカニズム、プライバシールーティング能力により、企業が自社のプライベート環境の中で安全にエージェント・システムを稼働させられる。

エヌビディアはさらに、Vera Rubin DSX AI工場の参照設計も打ち出しており、AI工場のインフラ・スタック全体をどのように設計し、構築し、運用するかを教える。計算、NVIDIA Spectrum-XEthernetネットワーク、そしてストレージを含み、再現可能で拡張可能、かつ最適なクラスタ性能を実現する。

黄仁勲は次のように述べた。「AI時代には、スマートなtokenが新しい通貨であり、AI工場はそれらのtokenを生成するためのインフラです。Vera Rubin DSX AI Factoryの参照設計とOmniverse DSX Blueprint(デジタルツイン・ブループリント)を通じて、私たちは世界で最高の生産性を持つAI工場を構築するための土台を提供し、初回収益までの期間を加速させ、規模とエネルギー効率を最大化しています。」

LPUを投入した後、エヌビディアのフラッグシップGPUの比率がどのように変化するのか。『華夏時報』の記者はこの点についてエヌビディア側に取材したが、原稿執筆時点では回答は得られていない。「エヌビディアが推論チップ市場に進出したことは、GPU事業が損なわれることを意味するのではありません。むしろ、LPUとの協調によって、より広い市場機会が生まれます。」と張孝榮氏は述べた。

智参智庫の特聘エキスパートである袁博氏は、次のように指摘する。短期的には、GPUは強力なシーン適応性とエコシステムの参入障壁によって市場を主導しており、特にAI訓練のシーンでは顕著である。しかし長期的には、この2つの路線は完全に対立するものではなく、融合と市場の階層化へ向かう。「ハードウェア面では、GPUはより強い専用コアを統合し、また専用チップもプログラマビリティが増していく。市場では、その主導的な革新と汎用プラットフォーム、ならびに専用チップによる大規模な推論への深耕という、階層的な構図が形成される見通しだ。」

ASIC市場では、実はすでにエヌビディアの対抗相手が一部集結している。国外ではCerebras、中国では寒武紀、華為、燧原科技などだ。張孝榮氏は、エヌビディアが推論チップ領域に進出することは国内メーカーにとって挑戦であると同時に触媒にもなり、「挤圧(圧迫)」と「背中を押す(追い立てる)」が共存する複雑な局面を生み出すだろうと考えている。これにより、業界の入れ替えと技術アップグレードが加速する。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • 人気の Gate Fun

    もっと見る
  • 時価総額:$2.27K保有者数:2
    0.00%
  • 時価総額:$2.37K保有者数:2
    1.04%
  • 時価総額:$2.24K保有者数:1
    0.00%
  • 時価総額:$2.24K保有者数:1
    0.00%
  • 時価総額:$2.25K保有者数:1
    0.00%
  • ピン