GTC 2026の基調講演で、英偉達の新しいチップ「Groq 3 LPU」が正式に発表されました。
北京时间火曜日深夜、英偉達はVera Rubinプラットフォームを正式に発表し、Groq 3 LPU(略称LPU)を含む合計7種類のチップを搭載しています。これらはVera CPU、Rubin GPU、NVLink 6スイッチ、ConnectX-9スーパーNIC、BlueField-4 DPU、Spectrum-6イーサネットスイッチです。
報道によると、英偉達は256個のLPUを搭載したGroq 3 LPXラックを構築し、128GB(各LPUに500MBのSRAMを統合)のSRAMと40 PB/sの推論アクセラレーション帯域幅を提供します。これらのチップは、各ラックの640 TB/sの専用拡張インターフェースを通じて接続されます。このラックは、Vera Rubin NVL72やVera CPUなどの他の4つのラックとともに、完全なAIスーパーコンピューティングプラットフォーム「Vera Rubin」を構成します。
英偉達は、Groq 3 LPXはVera Rubinの推論アクセラレータであり、インテリジェントエージェントシステムの低遅延と大規模コンテキスト要求に応えることを目的としていると述べています。Vera RubinとLPXは、協調設計されたアーキテクチャにより、Rubin GPUとLPUの優れた性能を完璧に融合させ、極低遅延と超大容量のスループットを実現しています。
黄仁勋氏は、LPXとVera Rubinプラットフォームの組み合わせにより、推論のスループット/電力効率比が35倍向上すると紹介しました。LPUチップはサムスンが製造し、今年後半から出荷開始予定です。
昨日、アナリストの郭明錤氏は、英偉達がGroqに投資した後、LPUの出荷予測が大幅に引き上げられたと述べました。2026年から2027年までの総出荷量は400万から500万個に達すると予測しています。新しいアーキテクチャのラックは今年第4四半期から量産開始予定で、2026年と2027年の出荷台数はそれぞれ約300〜500台と15,000〜20,000台と見込まれています。
彼の見解では、LPUの需要増加は外部要因によるものが大きいです。一つは、LPUが英偉達のエコシステム(CUDAなど)と高度に統合されており、アプリケーションの開発と展開のハードルを大きく下げていることです。もう一つは、現在業界で超低遅延推論の需要が急速に高まっており、AIエージェントやリアルタイム処理、エンドユーザー向けアプリケーション、フィジカルAIなどの新興用途が増加していることです。
また、黄仁勋氏は基調講演で、AIが感知型から生成型、さらに物理的知能やエージェント知能へと重要な進化を遂げたことも強調しました。
財通証券は、大規模モデルの推論過程には遅延が伴い、その遅延はユーザー体験に密接に関係していると指摘しています。大規模モデルの推論遅延の主なボトルネックはデコード段階のメモリ帯域幅にあり、LPUはより高速なメモリ帯域を持つことで推論遅延を短縮できるとしています。また、LPUを基盤とした大規模モデルは、推論速度が向上するだけでなく、コストパフォーマンスも良くなり、ユーザー体験の向上に寄与すると述べています。
同機関は、現在トークン消費量が大幅に増加しており、推論チップ市場の規模拡大を促していると分析しています。LPUは推論チップ市場に徐々に浸透し、高い成長性を持つ市場空間を有していると見ています。LPUの高い成長性と、ラック出荷時に得られるPCBの機会に注目し、次の企業に関心を持つことを推奨しています:智微智能(元川微に出資)、星宸科技(複数回の増資を実施)、沪電股份(英偉達のPCBサプライヤー)、勝宏科技(英偉達のPCBサプライヤー)、深南電路。
(出典:財聯社)
340.53K 人気度
49.97M 人気度
14.3K 人気度
2.11M 人気度
181.56K 人気度
LPU出荷の大幅増加見込み?NVIDIA、Vera Rubinプラットフォームを発表 各キャビネットに256個搭載
GTC 2026の基調講演で、英偉達の新しいチップ「Groq 3 LPU」が正式に発表されました。
北京时间火曜日深夜、英偉達はVera Rubinプラットフォームを正式に発表し、Groq 3 LPU(略称LPU)を含む合計7種類のチップを搭載しています。これらはVera CPU、Rubin GPU、NVLink 6スイッチ、ConnectX-9スーパーNIC、BlueField-4 DPU、Spectrum-6イーサネットスイッチです。
報道によると、英偉達は256個のLPUを搭載したGroq 3 LPXラックを構築し、128GB(各LPUに500MBのSRAMを統合)のSRAMと40 PB/sの推論アクセラレーション帯域幅を提供します。これらのチップは、各ラックの640 TB/sの専用拡張インターフェースを通じて接続されます。このラックは、Vera Rubin NVL72やVera CPUなどの他の4つのラックとともに、完全なAIスーパーコンピューティングプラットフォーム「Vera Rubin」を構成します。
英偉達は、Groq 3 LPXはVera Rubinの推論アクセラレータであり、インテリジェントエージェントシステムの低遅延と大規模コンテキスト要求に応えることを目的としていると述べています。Vera RubinとLPXは、協調設計されたアーキテクチャにより、Rubin GPUとLPUの優れた性能を完璧に融合させ、極低遅延と超大容量のスループットを実現しています。
黄仁勋氏は、LPXとVera Rubinプラットフォームの組み合わせにより、推論のスループット/電力効率比が35倍向上すると紹介しました。LPUチップはサムスンが製造し、今年後半から出荷開始予定です。
昨日、アナリストの郭明錤氏は、英偉達がGroqに投資した後、LPUの出荷予測が大幅に引き上げられたと述べました。2026年から2027年までの総出荷量は400万から500万個に達すると予測しています。新しいアーキテクチャのラックは今年第4四半期から量産開始予定で、2026年と2027年の出荷台数はそれぞれ約300〜500台と15,000〜20,000台と見込まれています。
彼の見解では、LPUの需要増加は外部要因によるものが大きいです。一つは、LPUが英偉達のエコシステム(CUDAなど)と高度に統合されており、アプリケーションの開発と展開のハードルを大きく下げていることです。もう一つは、現在業界で超低遅延推論の需要が急速に高まっており、AIエージェントやリアルタイム処理、エンドユーザー向けアプリケーション、フィジカルAIなどの新興用途が増加していることです。
また、黄仁勋氏は基調講演で、AIが感知型から生成型、さらに物理的知能やエージェント知能へと重要な進化を遂げたことも強調しました。
財通証券は、大規模モデルの推論過程には遅延が伴い、その遅延はユーザー体験に密接に関係していると指摘しています。大規模モデルの推論遅延の主なボトルネックはデコード段階のメモリ帯域幅にあり、LPUはより高速なメモリ帯域を持つことで推論遅延を短縮できるとしています。また、LPUを基盤とした大規模モデルは、推論速度が向上するだけでなく、コストパフォーマンスも良くなり、ユーザー体験の向上に寄与すると述べています。
同機関は、現在トークン消費量が大幅に増加しており、推論チップ市場の規模拡大を促していると分析しています。LPUは推論チップ市場に徐々に浸透し、高い成長性を持つ市場空間を有していると見ています。LPUの高い成長性と、ラック出荷時に得られるPCBの機会に注目し、次の企業に関心を持つことを推奨しています:智微智能(元川微に出資)、星宸科技(複数回の増資を実施)、沪電股份(英偉達のPCBサプライヤー)、勝宏科技(英偉達のPCBサプライヤー)、深南電路。
(出典:財聯社)