本日最も重要なことは、NVIDIA GTCカンファレンス。まさにAI版『サピエンス全史』だ。
ジェンスン・フアン(黄仁勲)はまだステージに上がっていないが、事前にリークされた情報量は、すでに本一冊分に相当する。
ワンワンが3大注目ポイントをまとめた。さあ、友よ、私についてこい。
前世代のBlackwellもすごかっただろう。今度は新チップVera Rubinの量産が発表される見込みだ。
Vera Rubinのすごさは何か?一言で言えば「安い」。
同じAIモデルを動かす場合、 チップ数は4分の1に削減、推論計算コストは9割減。 9割減だぞ、友よ。 AWS、Microsoft、Googleの三大クラウドベンダーが真っ先に導入を決めた。
以前ジェンスン・フアンは決算説明会で、Groqは拡張アーキテクチャとしてNVIDIAの体系に組み込まれると述べた。かつてMellanoxを買収してネットワーク機能を補完したのと同じだ。
GroqのLPUはNVIDIAのGPUと同じデータセンターに置かれ、GPUが問題を理解し、LPUが素早く答えを出力する責任を負う。
2種類のチップが役割分担して連携し、エージェントシナリオの遅延を直接削減する。
AIエージェントが人間の代わりに作業する際、タスクごとに何十回もモデルを呼び出す可能性があり、そのたびに推論計算リソースを消費する。しかもユーザーは待っているため、少しでも遅いと体験が台無しになる。
推論は2段階に分かれる。まずあなたの質問を理解し、次に一字一句答えを出力する。
GPUは第一段階に優れているが、第二段階の出力速度と安定性では、GroqのLPUが勝る。
200億ドルは高いか?
考えてみてほしい。今後すべての企業が何百ものエージェントを運用し、各エージェントが毎日何千回もモデルを呼び出すことになる。
オープンソースのプラットフォームで、企業が導入すればAI従業員をデプロイし、人間の代わりにフローを実行、データ処理、プロジェクト管理ができる。 すでにSalesforceやAdobeと交渉中とのこと。
面白いのは、NemoClawはNVIDIAのチップを使うことを必須としていない点だ。 このロジックを噛み締めてほしい。 チップを売るだけではハードウェア1層の利益しか得られないが、ルールを決めればチェーン全体から利益を得られる。ジェンスン・フアンはこの計算をよく理解している。
おそらく次々世代アーキテクチャFeynmanの初公開であり、2028年に量産予定、TSMCの最先端1.6nmプロセスを使用。
もう一つ、ニッチな情報で面白いと思うものがある。
NVIDIAがノートPC向けプロセッサをリリースする。2モデルで、ゲームに特化。 グラフィックカードを売る会社がCPUの飯を奪いに来たわけだ。
ワンワンは感じる、ジェンスン・フアンは将来、一代の偉人になるだろうと。
4.84M 人気度
1.08M 人気度
68.92K 人気度
242.2K 人気度
152.67M 人気度
今日最も重要なことは、NVIDIAのGTCカンファレンスです。まるでAI版の人類の簡史のようです。
本日最も重要なことは、NVIDIA GTCカンファレンス。まさにAI版『サピエンス全史』だ。
ジェンスン・フアン(黄仁勲)はまだステージに上がっていないが、事前にリークされた情報量は、すでに本一冊分に相当する。
ワンワンが3大注目ポイントをまとめた。さあ、友よ、私についてこい。
前世代のBlackwellもすごかっただろう。今度は新チップVera Rubinの量産が発表される見込みだ。
Vera Rubinのすごさは何か?一言で言えば「安い」。
同じAIモデルを動かす場合、 チップ数は4分の1に削減、推論計算コストは9割減。 9割減だぞ、友よ。 AWS、Microsoft、Googleの三大クラウドベンダーが真っ先に導入を決めた。
以前ジェンスン・フアンは決算説明会で、Groqは拡張アーキテクチャとしてNVIDIAの体系に組み込まれると述べた。かつてMellanoxを買収してネットワーク機能を補完したのと同じだ。
GroqのLPUはNVIDIAのGPUと同じデータセンターに置かれ、GPUが問題を理解し、LPUが素早く答えを出力する責任を負う。
2種類のチップが役割分担して連携し、エージェントシナリオの遅延を直接削減する。
AIエージェントが人間の代わりに作業する際、タスクごとに何十回もモデルを呼び出す可能性があり、そのたびに推論計算リソースを消費する。しかもユーザーは待っているため、少しでも遅いと体験が台無しになる。
推論は2段階に分かれる。まずあなたの質問を理解し、次に一字一句答えを出力する。
GPUは第一段階に優れているが、第二段階の出力速度と安定性では、GroqのLPUが勝る。
200億ドルは高いか?
考えてみてほしい。今後すべての企業が何百ものエージェントを運用し、各エージェントが毎日何千回もモデルを呼び出すことになる。
オープンソースのプラットフォームで、企業が導入すればAI従業員をデプロイし、人間の代わりにフローを実行、データ処理、プロジェクト管理ができる。 すでにSalesforceやAdobeと交渉中とのこと。
面白いのは、NemoClawはNVIDIAのチップを使うことを必須としていない点だ。 このロジックを噛み締めてほしい。 チップを売るだけではハードウェア1層の利益しか得られないが、ルールを決めればチェーン全体から利益を得られる。ジェンスン・フアンはこの計算をよく理解している。
おそらく次々世代アーキテクチャFeynmanの初公開であり、2028年に量産予定、TSMCの最先端1.6nmプロセスを使用。
もう一つ、ニッチな情報で面白いと思うものがある。
NVIDIAがノートPC向けプロセッサをリリースする。2モデルで、ゲームに特化。 グラフィックカードを売る会社がCPUの飯を奪いに来たわけだ。
ワンワンは感じる、ジェンスン・フアンは将来、一代の偉人になるだろうと。