Сегодня самое важное событие — конференция NVIDIA GTC, практически версия AI-истории человечества.

robot
Генерация тезисов в процессе

今天最重要的事,是英伟达GTC大会,简直一部AI版的人类简史。

黄仁勋还没上台呢,提前泄露的信息量已经够写一本书了。

晚晚整理了三大看点,来吧胖友们,跟我走。

1)AI算力成本直接打一折

上一代Blackwell已经很猛了对吧。马上要宣布新一代芯片Vera Rubin量产。

Vera Rubin猛在哪?说白了就俩字:便宜。

跑同样的AI模型, 芯片数量砍到四分之一,推理计算成本降九成。 降九成啊朋友们。 AWS、微软、Google三大云厂商直接第一批上车。

2)去年花200亿美元收的Groq,今天交作业

之前黄仁勋在业绩会上说,Groq会作为扩展架构接入英伟达体系,就像当年收Mellanox补齐了网络能力一样。

Groq的LPU跟英伟达GPU搁同一个数据中心,GPU理解问题,LPU负责快速吐答案。

两种芯片分工配合,Agent场景延迟直接打下来。

AI Agent替人干活,一个任务来来回回可能调模型几十轮,每一轮都在烧推理算力,而且用户在那等着呢,慢一点体验就崩。

推理分两步,先理解你的问题,再一个字一个字把答案吐出来。

GPU擅长第一步,但第二步吐字的速度和稳定性,Groq的LPU更强。

200亿贵吗?

你想想以后每家公司都跑几百个Agent,每个Agent每天调几千次模型。

3)英伟达版OpenClaw上线,叫NemoClaw

就是一套开源平台,企业装上就能部署AI员工替真人跑流程、处理数据、管项目。 据说已经在跟Salesforce、Adobe谈了。

有意思的地方在于,NemoClaw不要求你用英伟达的芯片。 你品品这个逻辑嘛。 卖芯片只赚硬件一层的钱,定规则才能赚整条链的钱。黄仁勋这笔账算得门儿清。

4)黄仁勋说要展示「世界从未见过的芯片」

大概率是下下代架构Feynman首次露面,2028年量产,台积电最先进的1.6nm工艺。

另外还有个冷门料我觉得挺有意思。

英伟达出笔记本电脑处理器了,两款,主打游戏。 卖显卡的要来抢CPU的饭碗了啊。

晚晚我感觉,黄仁勋未来要成为一代伟人了。

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Горячее на Gate Fun

    Подробнее
  • РК:$2.27KДержатели:1
    0.00%
  • РК:$2.27KДержатели:1
    0.00%
  • РК:$0.1Держатели:0
    0.00%
  • РК:$0.1Держатели:1
    0.00%
  • РК:$2.24KДержатели:1
    0.00%
  • Закрепить