今日いちばん重要なことは、エヌビディアのGTCカンファレンスで、まるでAI版の人類史のようだ。ジェン・ファン(黄仁勋)がまだ登壇していないのに、先行して漏れた情報量だけで本1冊分になりそうだ。ナンナン(晚晚)が3つの注目ポイントを整理したよ。さあ、みんな行こう、ついてきて。1)AI計算力のコストが直接1割引き前世代のBlackwellもかなりすごかったよね。次は新世代チップのVera Rubinを量産発表する。Vera Rubinがどこがすごいの?端的に言うと、2つだけ。安い。同じAIモデルを動かすと、チップの数が4分の1まで削減され、推論計算コストが9割下がる。9割下がるんだよ、みんな。AWS、マイクロソフト、Googleの3大クラウド事業者が、直接最初のバッチで導入する。2)昨年200億ドルで買収したGroq、今日は課題提出以前ジェン・ファンが決算説明会で言っていたのは、Groqは拡張アーキテクチャとしてエヌビディアの体系に接続される、ということ。まるで当時Mellanoxを買収してネットワーク能力を補ったのと同じだ。GroqのLPUはエヌビディアのGPUと同じデータセンターに置かれ、GPUが問題を理解し、LPUが高速に答えを吐き出す。2種類のチップが役割分担して連携することで、Agentシーンのレイテンシーはそのまま打ち下がる。AI Agentは人の代わりに仕事をする。1つのタスクで行ったり来たりして、モデルを数十ラウンド調整する可能性がある。そして各ラウンドで推論計算力が燃えていく。しかもユーザーはそこで待っているわけで、少しでも遅いと体験が崩れる。推論は2段階で、まずあなたの問題を理解し、次に1文字ずつ答えを吐き出す。GPUは最初の段階が得意。でも2つ目の「文字を吐く速度と安定性」は、GroqのLPUのほうが強い。200億ドルって高いの?考えてみて。これから各社が何百ものAgentを動かして、それぞれのAgentが毎日何千回もモデルを調整するんだよ。3)エヌビディア版OpenClawが登場、名前はNemoClawこれはオープンソースのプラットフォーム一式で、企業が導入すればAIの従業員をデプロイして、実際の人の代わりに業務フローを回し、データを処理し、プロジェクトを運用できる。すでにSalesforce、Adobeと交渉しているという話だ。面白いのは、NemoClawがエヌビディアのチップを使うことを要求していない点。このロジックをよく味わってみて。チップはハードウェアの1層だけで稼いで、ルールを決めればチェーン全体で稼げる。ジェン・ファンのこの計算は、さすがに抜け目がない。4)ジェン・ファンが「世界がこれまで見たことのないチップ」を披露すると言ったおそらく、次の次の世代アーキテクチャFeynmanが初めて登場するんだろう。2028年に量産、台湾積体電路(TSMC)の最先端1.6nmプロセス。それとは別に、もう一つのクールなネタがあって、これがけっこう面白いと思う。エヌビディアがノートPC用のプロセッサを出した。2つあって、ゲームが主役。グラボを売ってる側が、CPUの食い扶持を取りに来るわけだね。ナンナン、私はジェン・ファンが将来、一世代を代表する偉人になりそうな気がする。
今日最重要なことは、NVIDIA GTCカンファレンスであり、まるでAI版の人類史のようだ。
今日いちばん重要なことは、エヌビディアのGTCカンファレンスで、まるでAI版の人類史のようだ。
ジェン・ファン(黄仁勋)がまだ登壇していないのに、先行して漏れた情報量だけで本1冊分になりそうだ。
ナンナン(晚晚)が3つの注目ポイントを整理したよ。さあ、みんな行こう、ついてきて。
1)AI計算力のコストが直接1割引き
前世代のBlackwellもかなりすごかったよね。次は新世代チップのVera Rubinを量産発表する。
Vera Rubinがどこがすごいの?端的に言うと、2つだけ。安い。
同じAIモデルを動かすと、 チップの数が4分の1まで削減され、推論計算コストが9割下がる。 9割下がるんだよ、みんな。 AWS、マイクロソフト、Googleの3大クラウド事業者が、直接最初のバッチで導入する。
2)昨年200億ドルで買収したGroq、今日は課題提出
以前ジェン・ファンが決算説明会で言っていたのは、Groqは拡張アーキテクチャとしてエヌビディアの体系に接続される、ということ。まるで当時Mellanoxを買収してネットワーク能力を補ったのと同じだ。
GroqのLPUはエヌビディアのGPUと同じデータセンターに置かれ、GPUが問題を理解し、LPUが高速に答えを吐き出す。
2種類のチップが役割分担して連携することで、Agentシーンのレイテンシーはそのまま打ち下がる。
AI Agentは人の代わりに仕事をする。1つのタスクで行ったり来たりして、モデルを数十ラウンド調整する可能性がある。そして各ラウンドで推論計算力が燃えていく。しかもユーザーはそこで待っているわけで、少しでも遅いと体験が崩れる。
推論は2段階で、まずあなたの問題を理解し、次に1文字ずつ答えを吐き出す。
GPUは最初の段階が得意。でも2つ目の「文字を吐く速度と安定性」は、GroqのLPUのほうが強い。
200億ドルって高いの?
考えてみて。これから各社が何百ものAgentを動かして、それぞれのAgentが毎日何千回もモデルを調整するんだよ。
3)エヌビディア版OpenClawが登場、名前はNemoClaw
これはオープンソースのプラットフォーム一式で、企業が導入すればAIの従業員をデプロイして、実際の人の代わりに業務フローを回し、データを処理し、プロジェクトを運用できる。 すでにSalesforce、Adobeと交渉しているという話だ。
面白いのは、NemoClawがエヌビディアのチップを使うことを要求していない点。 このロジックをよく味わってみて。 チップはハードウェアの1層だけで稼いで、ルールを決めればチェーン全体で稼げる。ジェン・ファンのこの計算は、さすがに抜け目がない。
4)ジェン・ファンが「世界がこれまで見たことのないチップ」を披露すると言った
おそらく、次の次の世代アーキテクチャFeynmanが初めて登場するんだろう。2028年に量産、台湾積体電路(TSMC)の最先端1.6nmプロセス。
それとは別に、もう一つのクールなネタがあって、これがけっこう面白いと思う。
エヌビディアがノートPC用のプロセッサを出した。2つあって、ゲームが主役。 グラボを売ってる側が、CPUの食い扶持を取りに来るわけだね。
ナンナン、私はジェン・ファンが将来、一世代を代表する偉人になりそうな気がする。