今天最重要的事,是英偉達GTC大會,簡直是一部AI版的人類簡史。
黃仁勛還沒上台呢,提前洩露的資訊量已經夠寫一本書了。
晚晚整理了三大看點,來吧胖友們,跟我走。
1)AI算力成本直接打一折
上一代Blackwell已經很猛了對吧。馬上要宣布新一代晶片Vera Rubin量產。
Vera Rubin猛在哪?說白了就俩字:便宜。
跑同樣的AI模型, 晶片數量砍到四分之一,推理計算成本降九成。 降九成啊朋友們。 AWS、微軟、Google三大雲廠商直接第一批上車。
2)去年花200億美元收的Groq,今天交作業
之前黃仁勛在業績會上說,Groq會作為擴展架構接入英偉達體系,就像當年收Mellanox補齊了網路能力一樣。
Groq的LPU跟英偉達GPU擺同一個資料中心,GPU理解問題,LPU負責快速吐答案。
兩種晶片分工配合,Agent場景延遲直接打下來。
AI Agent替人幹活,一個任務來來回回可能調模型幾十輪,每一輪都在燒推理算力,而且用戶在那等著呢,慢一點體驗就崩。
推理分兩步,先理解你的問題,再一個字一個字把答案吐出來。
GPU擅長第一步,但第二步吐字的速度和穩定性,Groq的LPU更強。
200億貴嗎?
你想想以後每家公司都跑幾百個Agent,每個Agent每天調幾千次模型。
3)英偉達版OpenClaw上線,叫NemoClaw
就是一套開源平台,企業裝上就能部署AI員工替真人跑流程、處理資料、管專案。 據說已經在跟Salesforce、Adobe談了。
有意思的地方在於,NemoClaw不要求你用英偉達的晶片。 你品品這個邏輯嘛。 賣晶片只賺硬體一層的錢,定規則才能賺整條鏈的錢。黃仁勛這筆帳算得門兒清。
4)黃仁勛說要展示「世界從未見過的晶片」
大概率是下下代架構Feynman首次露面,2028年量產,台積電最先進的1.6nm工藝。
另外還有個冷門料我覺得挺有意思。
英偉達出筆記本電腦處理器了,兩款,主打遊戲。 賣顯卡的要來搶CPU的飯碗了啊。
晚晚我感覺,黃仁勛未來要成為一代偉人了。
4.23萬 熱度
126.94萬 熱度
1819.93萬 熱度
957.98萬 熱度
80.36萬 熱度
今天最重要的事,是英伟达GTC大会,簡直一部AI版的人類簡史。
今天最重要的事,是英偉達GTC大會,簡直是一部AI版的人類簡史。
黃仁勛還沒上台呢,提前洩露的資訊量已經夠寫一本書了。
晚晚整理了三大看點,來吧胖友們,跟我走。
1)AI算力成本直接打一折
上一代Blackwell已經很猛了對吧。馬上要宣布新一代晶片Vera Rubin量產。
Vera Rubin猛在哪?說白了就俩字:便宜。
跑同樣的AI模型, 晶片數量砍到四分之一,推理計算成本降九成。 降九成啊朋友們。 AWS、微軟、Google三大雲廠商直接第一批上車。
2)去年花200億美元收的Groq,今天交作業
之前黃仁勛在業績會上說,Groq會作為擴展架構接入英偉達體系,就像當年收Mellanox補齊了網路能力一樣。
Groq的LPU跟英偉達GPU擺同一個資料中心,GPU理解問題,LPU負責快速吐答案。
兩種晶片分工配合,Agent場景延遲直接打下來。
AI Agent替人幹活,一個任務來來回回可能調模型幾十輪,每一輪都在燒推理算力,而且用戶在那等著呢,慢一點體驗就崩。
推理分兩步,先理解你的問題,再一個字一個字把答案吐出來。
GPU擅長第一步,但第二步吐字的速度和穩定性,Groq的LPU更強。
200億貴嗎?
你想想以後每家公司都跑幾百個Agent,每個Agent每天調幾千次模型。
3)英偉達版OpenClaw上線,叫NemoClaw
就是一套開源平台,企業裝上就能部署AI員工替真人跑流程、處理資料、管專案。 據說已經在跟Salesforce、Adobe談了。
有意思的地方在於,NemoClaw不要求你用英偉達的晶片。 你品品這個邏輯嘛。 賣晶片只賺硬體一層的錢,定規則才能賺整條鏈的錢。黃仁勛這筆帳算得門兒清。
4)黃仁勛說要展示「世界從未見過的晶片」
大概率是下下代架構Feynman首次露面,2028年量產,台積電最先進的1.6nm工藝。
另外還有個冷門料我覺得挺有意思。
英偉達出筆記本電腦處理器了,兩款,主打遊戲。 賣顯卡的要來搶CPU的飯碗了啊。
晚晚我感覺,黃仁勛未來要成為一代偉人了。