今天最重要的事,是英伟达GTC大会,简直一部AI版的人类简史。
黄仁勋还没上台呢,提前泄露的信息量已经够写一本书了。
晚晚整理了三大看点,来吧胖友们,跟我走。
1)AI算力成本直接打一折
上一代Blackwell已经很猛了对吧。马上要宣布新一代芯片Vera Rubin量产。
Vera Rubin猛在哪?说白了就俩字:便宜。
跑同样的AI模型, 芯片数量砍到四分之一,推理计算成本降九成。 降九成啊朋友们。 AWS、微软、Google三大云厂商直接第一批上车。
2)去年花200亿美元收的Groq,今天交作业
之前黄仁勋在业绩会上说,Groq会作为扩展架构接入英伟达体系,就像当年收Mellanox补齐了网络能力一样。
Groq的LPU跟英伟达GPU搁同一个数据中心,GPU理解问题,LPU负责快速吐答案。
两种芯片分工配合,Agent场景延迟直接打下来。
AI Agent替人干活,一个任务来来回回可能调模型几十轮,每一轮都在烧推理算力,而且用户在那等着呢,慢一点体验就崩。
推理分两步,先理解你的问题,再一个字一个字把答案吐出来。
GPU擅长第一步,但第二步吐字的速度和稳定性,Groq的LPU更强。
200亿贵吗?
你想想以后每家公司都跑几百个Agent,每个Agent每天调几千次模型。
3)英伟达版OpenClaw上线,叫NemoClaw
就是一套开源平台,企业装上就能部署AI员工替真人跑流程、处理数据、管项目。 据说已经在跟Salesforce、Adobe谈了。
有意思的地方在于,NemoClaw不要求你用英伟达的芯片。 你品品这个逻辑嘛。 卖芯片只赚硬件一层的钱,定规则才能赚整条链的钱。黄仁勋这笔账算得门儿清。
4)黄仁勋说要展示「世界从未见过的芯片」
大概率是下下代架构Feynman首次露面,2028年量产,台积电最先进的1.6nm工艺。
另外还有个冷门料我觉得挺有意思。
英伟达出笔记本电脑处理器了,两款,主打游戏。 卖显卡的要来抢CPU的饭碗了啊。
晚晚我感觉,黄仁勋未来要成为一代伟人了。
4.23万 热度
126.94万 热度
1819.93万 热度
957.98万 热度
80.36万 热度
今天最重要的事,是英伟达GTC大会,简直一部AI版的人类简史。
今天最重要的事,是英伟达GTC大会,简直一部AI版的人类简史。
黄仁勋还没上台呢,提前泄露的信息量已经够写一本书了。
晚晚整理了三大看点,来吧胖友们,跟我走。
1)AI算力成本直接打一折
上一代Blackwell已经很猛了对吧。马上要宣布新一代芯片Vera Rubin量产。
Vera Rubin猛在哪?说白了就俩字:便宜。
跑同样的AI模型, 芯片数量砍到四分之一,推理计算成本降九成。 降九成啊朋友们。 AWS、微软、Google三大云厂商直接第一批上车。
2)去年花200亿美元收的Groq,今天交作业
之前黄仁勋在业绩会上说,Groq会作为扩展架构接入英伟达体系,就像当年收Mellanox补齐了网络能力一样。
Groq的LPU跟英伟达GPU搁同一个数据中心,GPU理解问题,LPU负责快速吐答案。
两种芯片分工配合,Agent场景延迟直接打下来。
AI Agent替人干活,一个任务来来回回可能调模型几十轮,每一轮都在烧推理算力,而且用户在那等着呢,慢一点体验就崩。
推理分两步,先理解你的问题,再一个字一个字把答案吐出来。
GPU擅长第一步,但第二步吐字的速度和稳定性,Groq的LPU更强。
200亿贵吗?
你想想以后每家公司都跑几百个Agent,每个Agent每天调几千次模型。
3)英伟达版OpenClaw上线,叫NemoClaw
就是一套开源平台,企业装上就能部署AI员工替真人跑流程、处理数据、管项目。 据说已经在跟Salesforce、Adobe谈了。
有意思的地方在于,NemoClaw不要求你用英伟达的芯片。 你品品这个逻辑嘛。 卖芯片只赚硬件一层的钱,定规则才能赚整条链的钱。黄仁勋这笔账算得门儿清。
4)黄仁勋说要展示「世界从未见过的芯片」
大概率是下下代架构Feynman首次露面,2028年量产,台积电最先进的1.6nm工艺。
另外还有个冷门料我觉得挺有意思。
英伟达出笔记本电脑处理器了,两款,主打游戏。 卖显卡的要来抢CPU的饭碗了啊。
晚晚我感觉,黄仁勋未来要成为一代伟人了。