エヌビディアは初のGroqチップLPXを発表:Vera Rubinとの組み合わせにより、メガワットあたりの推論効率が最大35倍向上し、次世代のKyberプロトタイプも展示されました。

robot
概要作成中

币界网消息,据 1M AI News 监测,Groq 3 LPU(言語処理ユニット)は、NVIDIAが昨年12月にAI推論チップのスタートアップ企業Groqを約200億ドルで買収した後にリリースされた最初のチップであり、今年の第3四半期から出荷開始予定です。Groq 3 LPXラックは256個のLPUを収容でき、128GBのオンチップSRAMと毎秒640TBの拡張インターコネクト帯域を備えています。公式によると、LPXはVera Rubin NVL72と組み合わせて展開することで、1メガワットあたりの推論スループットを最大35倍向上させるとともに、兆のパラメータや百万トークンのコンテキスト推論シナリオにおける収益潜在力を解き放ちます。黄仁勲は、両方のプロセッサを「極端に異なるが相互に統一されたもの」と表現し、LPXのオンチップメモリはモデルの利用可能な総メモリ容量を大幅に拡張します。LPXラックは、今年下半期にVera Rubinプラットフォームとともに発売される予定です。カンファレンスでは、黄仁勲はコードネームKyberの次世代ラックアーキテクチャのプロトタイプも披露しました。Kyberは144個のGPU計算トレイを垂直配置に変更し、物理密度を向上させ、遅延を低減します。Vera Rubinの後継プラットフォームであるVera Rubin Ultraに搭載され、2027年のリリースが予定されています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン