今日最重要なことは、NVIDIA GTCカンファレンスであり、まるでAI版の人類史のようだ。

robot
概要作成中

今日いちばん重要なことは、エヌビディアのGTCカンファレンスで、まるでAI版の人類史のようだ。

ジェン・ファン(黄仁勋)がまだ登壇していないのに、先行して漏れた情報量だけで本1冊分になりそうだ。

ナンナン(晚晚)が3つの注目ポイントを整理したよ。さあ、みんな行こう、ついてきて。

1)AI計算力のコストが直接1割引き

前世代のBlackwellもかなりすごかったよね。次は新世代チップのVera Rubinを量産発表する。

Vera Rubinがどこがすごいの?端的に言うと、2つだけ。安い。

同じAIモデルを動かすと、 チップの数が4分の1まで削減され、推論計算コストが9割下がる。 9割下がるんだよ、みんな。 AWS、マイクロソフト、Googleの3大クラウド事業者が、直接最初のバッチで導入する。

2)昨年200億ドルで買収したGroq、今日は課題提出

以前ジェン・ファンが決算説明会で言っていたのは、Groqは拡張アーキテクチャとしてエヌビディアの体系に接続される、ということ。まるで当時Mellanoxを買収してネットワーク能力を補ったのと同じだ。

GroqのLPUはエヌビディアのGPUと同じデータセンターに置かれ、GPUが問題を理解し、LPUが高速に答えを吐き出す。

2種類のチップが役割分担して連携することで、Agentシーンのレイテンシーはそのまま打ち下がる。

AI Agentは人の代わりに仕事をする。1つのタスクで行ったり来たりして、モデルを数十ラウンド調整する可能性がある。そして各ラウンドで推論計算力が燃えていく。しかもユーザーはそこで待っているわけで、少しでも遅いと体験が崩れる。

推論は2段階で、まずあなたの問題を理解し、次に1文字ずつ答えを吐き出す。

GPUは最初の段階が得意。でも2つ目の「文字を吐く速度と安定性」は、GroqのLPUのほうが強い。

200億ドルって高いの?

考えてみて。これから各社が何百ものAgentを動かして、それぞれのAgentが毎日何千回もモデルを調整するんだよ。

3)エヌビディア版OpenClawが登場、名前はNemoClaw

これはオープンソースのプラットフォーム一式で、企業が導入すればAIの従業員をデプロイして、実際の人の代わりに業務フローを回し、データを処理し、プロジェクトを運用できる。 すでにSalesforce、Adobeと交渉しているという話だ。

面白いのは、NemoClawがエヌビディアのチップを使うことを要求していない点。 このロジックをよく味わってみて。 チップはハードウェアの1層だけで稼いで、ルールを決めればチェーン全体で稼げる。ジェン・ファンのこの計算は、さすがに抜け目がない。

4)ジェン・ファンが「世界がこれまで見たことのないチップ」を披露すると言った

おそらく、次の次の世代アーキテクチャFeynmanが初めて登場するんだろう。2028年に量産、台湾積体電路(TSMC)の最先端1.6nmプロセス。

それとは別に、もう一つのクールなネタがあって、これがけっこう面白いと思う。

エヌビディアがノートPC用のプロセッサを出した。2つあって、ゲームが主役。 グラボを売ってる側が、CPUの食い扶持を取りに来るわけだね。

ナンナン、私はジェン・ファンが将来、一世代を代表する偉人になりそうな気がする。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン