今日最も重要なことは、NVIDIAのGTCカンファレンスです。まるでAI版の人類の簡史のようです。

robot
概要作成中

本日最も重要なことは、NVIDIA GTCカンファレンス。まさにAI版『サピエンス全史』だ。

ジェンスン・フアン(黄仁勲)はまだステージに上がっていないが、事前にリークされた情報量は、すでに本一冊分に相当する。

ワンワンが3大注目ポイントをまとめた。さあ、友よ、私についてこい。

  1. AI計算コストが直接1割に

前世代のBlackwellもすごかっただろう。今度は新チップVera Rubinの量産が発表される見込みだ。

Vera Rubinのすごさは何か?一言で言えば「安い」。

同じAIモデルを動かす場合、 チップ数は4分の1に削減、推論計算コストは9割減。 9割減だぞ、友よ。 AWS、Microsoft、Googleの三大クラウドベンダーが真っ先に導入を決めた。

  1. 昨年200億ドルで買収したGroq、本日成果を披露

以前ジェンスン・フアンは決算説明会で、Groqは拡張アーキテクチャとしてNVIDIAの体系に組み込まれると述べた。かつてMellanoxを買収してネットワーク機能を補完したのと同じだ。

GroqのLPUはNVIDIAのGPUと同じデータセンターに置かれ、GPUが問題を理解し、LPUが素早く答えを出力する責任を負う。

2種類のチップが役割分担して連携し、エージェントシナリオの遅延を直接削減する。

AIエージェントが人間の代わりに作業する際、タスクごとに何十回もモデルを呼び出す可能性があり、そのたびに推論計算リソースを消費する。しかもユーザーは待っているため、少しでも遅いと体験が台無しになる。

推論は2段階に分かれる。まずあなたの質問を理解し、次に一字一句答えを出力する。

GPUは第一段階に優れているが、第二段階の出力速度と安定性では、GroqのLPUが勝る。

200億ドルは高いか?

考えてみてほしい。今後すべての企業が何百ものエージェントを運用し、各エージェントが毎日何千回もモデルを呼び出すことになる。

  1. NVIDIA版OpenClawが登場、名称はNemoClaw

オープンソースのプラットフォームで、企業が導入すればAI従業員をデプロイし、人間の代わりにフローを実行、データ処理、プロジェクト管理ができる。 すでにSalesforceやAdobeと交渉中とのこと。

面白いのは、NemoClawはNVIDIAのチップを使うことを必須としていない点だ。 このロジックを噛み締めてほしい。 チップを売るだけではハードウェア1層の利益しか得られないが、ルールを決めればチェーン全体から利益を得られる。ジェンスン・フアンはこの計算をよく理解している。

  1. ジェンスン・フアンは「世界がこれまで見たことのないチップ」を披露すると述べた

おそらく次々世代アーキテクチャFeynmanの初公開であり、2028年に量産予定、TSMCの最先端1.6nmプロセスを使用。

もう一つ、ニッチな情報で面白いと思うものがある。

NVIDIAがノートPC向けプロセッサをリリースする。2モデルで、ゲームに特化。 グラフィックカードを売る会社がCPUの飯を奪いに来たわけだ。

ワンワンは感じる、ジェンスン・フアンは将来、一代の偉人になるだろうと。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め