Registo completo da sessão de perguntas e respostas estratégicas fechadas de Jensen Huang no GTC: Com encomendas de mais de um trilhão de dólares, confrontos acalorados com analistas de Wall Street, previsão do colapso do império de software de 2 trilhões, e uma revelação detalhada da nova oportunidade de 8 trilhões de dólares dos Agentes de IA

问AI · Token经济学将如何颠覆传统软件产业?

城主说|在昨天的2小时主题演讲之后,黄仁勋今天再次出现在GTC2026现场, 进行了一次面向金融分析师的闭门长篇问答,回应了很多尖锐问题。

黄仁勋在这个问答里详细阐述了数据中心如何从计算工具演变为制造 Token 的“AI 工厂”,并披露了对 Blackwell 和 Rubin 架构超过 1 万亿美元的市场需求预见。讨论涵盖了 Tokenomics(Token 经济学)如何重塑 IT 软件产业、物理 AI 的巨大潜力、硬件架构(包括 Groq 与铜连接技术)的演进,以及公司在保持高毛利率的同时为股东创造价值的战略。

00:00:02 AI发展的第三个拐点与代理式系统

00:10:21 代币经济学与一万亿美元市场前景

00:19:24 软件产业重塑与AI投资回报路径

00:30:06 硬件架构演进:Rubin与GROC的差异化定位

00:42:06 全栈AI工厂设计:内存优化与机架架构

00:50:52 资本策略与竞争护城河:理解工厂产出效率

00:59:23 数据中心连接演进:从铜缆到硅光技术的转型

01:08:59 降低代币成本与混合专家模型的技术创新

01:17:55 AI愿景展望:物理机器人与训练推理的融合

核心观点

  • • AI 的第三个拐点:行业已从生成式 AI、推理阶段步入“代理式系统(Agentic Systems)”,AI 能够自主执行复杂任务。

  • • 计算即制造:计算机已从工具转变为制造设备(AI 工厂),其产出物是具有经济价值的 Token,衡量标准是单位功耗下的 Token 生成效率。

  • • 万亿市场规模:NVIDIA 对 Blackwell 和 Rubin 在 2027 年前的市场可视化需求充满信心,规模超过 1 万亿美元。

  • • IT 产业转型:传统的 2 万亿美元软件许可行业正在向通过代理系统转售 Token 的模式转型,市场规模有望扩张至 8 万亿美元。

  • • 全栈架构优势:通过整合 GPU、CPU(Grace)、存储和网络,NVIDIA 能够触及 40% 的非超大规模云厂商市场(如企业、工业和边缘端)。

  • • “AI 已经从对话式步入‘代理式’阶段,它不再只是回答问题,而是开始执行任务。”

  • • “未来的计算机不再是工具,而是制造设备,产出的核心产品是具有经济价值的 Token。”

  • • “我们对 Blackwell 和 Rubin 的可视化需求已超过 1 万亿美元,这不是一个浮点数,而是明确的订单与可见性。”

  • • “传统的 2 万亿美元软件许可行业,正向通过代理系统转售 Token 的模式转型,市场规模有望扩张至 8 万亿美元。”

  • • “如果你不了解 Token 经济学(Tokenomics),你就不了解 AI 生意。购买成本最低的设备并不代表赢,单位功耗下的 Token 生成效率才是王道。”

  • • “物理 AI 的规模将远超数字 AI,因为世界不是发生在笔记本电脑里,而是发生在原子存在的物理空间。”

AI 的第三个拐点:从“回答问题”到“执行任务”

黄仁勋明确指出,行业正处于生成式 AI 演进的关键十字路口。如果说第一波浪潮是内容的生成,第二波是推理能力的普及,那么现在我们正身处第三个拐点——代理式系统(Agentic Systems)。这些系统具备自主性,能够根据设定的目标拆解并执行复杂任务。

这种转变直接重塑了人才的定义和企业的运营模式。“过去,当工程师入职时,公司给他们配备的是一台笔记本电脑。而现在,你给他们的不仅是电脑,还有 Token 预算。” 黄仁勋强调,如果一位高薪工程师在工作中不消耗 Token,那么他的产出将受到质疑。在这种语境下,OpenClaw 等开源项目不再是“玩具”,而是 AI 时代的操作系统,负责调度资源、管理网络并驱动代理执行任务。

计算即制造:迈向万亿美金的“AI 工厂”

英伟达正在重新定义计算机的本质。黄仁勋将现代数据中心比作 ASML 的制造设备或发电厂:其原材料是电力,产出物则是具有高度经济价值的 Token。这意味着,衡量算力优劣的标准不再是单纯的芯片价格,而是“Token 经济学”。

“计算机曾经仅仅是一个工具,未来的计算机是制造设备。它们的能源效率和生产效率至关重要,因为这决定了你的收入。” 黄仁勋指出,客户购买昂贵的 Blackwell 系统并非为了转售硬件,而是为了生产成本最低、价值最高的 Token。英伟达通过持续提升单位功耗下的 Token 生成效率,确保了其产品在即便单价更高的情况下,依然具备不可替代的投资回报率(ROI)。

路线图的底气:Blackwell 与 Rubin 带来的万亿可见度

针对市场对 AI 投资可持续性的疑虑,黄仁勋给出了极其强硬的数据回击。他透露,英伟达对 Blackwell 和 Rubin 架构在 2027 年前的可视化需求充满信心,规模已超过 1 万亿美元。

“这可不是一个浮点数,我们对超过 1 万亿美元的市场规模有着清晰的预见、明确的需求预测以及采购订单。” 这种可见性不仅来自于超大规模云服务商(CSPs),更来自于英伟达的全栈平台优势。黄仁勋解释道,通过整合 Grace CPU、GPU、网络与存储,英伟达能够触及那 40% 无法通过单一芯片满足的非超规模市场(如企业内部部署、工业边缘端等)。“如果你仅仅是制造芯片,那 40% 的市场是绝对不可能实现的,因为他们买的是平台。”

Token 经济学:IT 产业的 8 万亿美元转型

访谈中,黄仁勋提出了一个震撼的预测:全球 2 万亿美元的软件许可行业正面临转型。未来的 IT 公司将不再仅仅授权软件,而是成为 Token 的分销商和转售商。

“当前的 IT 行业可能会从 2 万亿美元变成 8 万亿美元。全球 100% 的 IT 行业都将成为 OpenAI、Anthropic 等模型能力的转售商。” 这种商业模式的改变意味着毛利率结构的重塑。虽然增加了 Token 生产的销售成本(COGS),但由于 AI 代理提供了远超传统软件的价值,整体市场空间将成倍放大。“未来的技术公司将出租 Token、生成 Token,它们的商业模式将发生根本性改变。”

硬件架构的博弈:GROC、铜连接与液冷革命

在技术实现的微观层面,英伟达展示了其极其细腻的架构平衡术。黄仁勋深入解析了 GROC 架构在推理市场中的地位,认为其极低延迟的特性将占据约 25% 的高阶推理市场。

同时,关于“光进铜退”的争议,黄仁勋给出了务实的判断:“你应该尽可能长久地使用铜技术,因为它可靠且易于制造。直到物理极限无法逾越时,我们才会转向 CPO(光电共封装)。” 他透露,即使在向 1152 架构演进的过程中,英伟达仍将在存储、管理和特定连接中大量保留铜连接,以维持系统的韧性与成本优势。此外,全液冷机架的设计已成为英伟达 AI 工厂的标准配置,以支撑日益暴涨的功率需求。

物理 AI:人工智能的终极疆域

尽管数字 AI 正在如火如荼地重塑办公室工作,但黄仁勋认为真正的蓝海在于物理世界。他预言物理 AI 最终将占据 70% 的市场份额。

“全球与物理 AI 相关的产业规模远大于数字 AI。世界并不是发生在我们的笔记本电脑里,而是发生在它原本存在的地方。” 从工厂自动化到自动驾驶,再到具备长效记忆的机器人,物理 AI 要求模型处理的是连续的物理法则而非简单的离散 Token。这不仅对算力提出了更高的要求,也让英伟达的 Omniverse 等模拟平台成为了物理 AI 训练不可或缺的基石。

推理即思考,算力即国力

最后,黄仁勋重申:未来 99% 的算力都将用于推理。“没有人会为学习本身买单,人们为结果付费。推理是将 Token 转化为经济价值的过程。”

这种从“预训练”到“后训练”再到“实时推理”的连续体,正是英伟达全栈实力的体现。英伟达不仅在制造芯片,更在制定 AI 时代的节奏。在这个万亿美金的工厂里,每一个生成的 Token 都在重新定义生产力的边界。正如黄仁勋所言,如果你不理解这套经济逻辑,你就注定会被这个新时代抛弃。

Web3天空之城全文整理


AI 的三个拐点与代理式系统的兴起

主持人: 大家早上好。希望你们喜欢昨天的演示。虽然时间稍微长了一点,但这对我们来说是一次非常棒的总结。接下来我们将利用这段时间关注你们的需求以及一些后续问题。我们将从几张幻灯片开始,或许是第一张左右,然后开放提问环节,对此我将交给 Jensen。

黄仁勋: 正如我昨天所说,近期 AI 领域出现了三个拐点。第一个是生成式 AI。第二个是推理。我们现在正处于第三个拐点,每一个拐点都建立在前一个基础之上。每一个拐点建立在前一个基础之上都有很多技术原因。现在我们来到了第三个拐点,即代理式系统。

能够自主运作的 Agentic systems,之所以称之为 Agentic,是因为它们具备代理能力,你可以为它们设定目标。它们现在不再仅仅是回答问题,而是能够执行任务。任务的内容包罗万象,当然,Agentic systems 最热门的应用之一就是编写软件。相信在你们公司,当然也包括我的公司,工程师们整天都在使用 Agentic systems。

过去,当工程师入职时,公司给他们配备的是一台笔记本电脑。而现在,当你入职时,公司给你的不仅是笔记本电脑,还有 tokens。token 预算现在已经成为现实。每位工程师都将拥有自己的 token 预算。试想一下,你聘请了一位年薪 300,000 美元的工程师,如果他们在工作中不消耗任何 token,你就不得不质疑:他们到底在做什么?因此,现在非常明确的一点是,每一位工程师都将拥有大量我们必须消耗的 tokens。而这些 token 将会被生产出来。

刚才我提到了一点,如果你能将这些点串联起来,以前当工程师或软件程序员来上班时,我们会给他们一台笔记本电脑。那是一个工具。如今,我们给他们的是笔记本电脑和 token。这些 token 必须经过制造。因此,计算机曾经仅仅是一个工具。未来的计算机是制造设备。所以,如你所见,这些计算机在未来与 ASML 的制造设备别无二致。它们正在生产可供销售的产品。这与很久以前生产电力的发电机没有任何区别。这些是制造系统。它们的能源效率和生产效率至关重要,因为这决定了你的收入。明白吗?所以第三个转折点就在这里。

Open Source。许多这类开源项目刚发布时,看起来像玩具一样。如果你退一步,从第一性原理去分析 Open Source 到底是什么。我昨天已经解释过了。

从第一性原理来看,Open Source 是一台计算机,是 AI 计算机的操作系统。一台计算机,一台个人 AI 计算机。它具备了计算系统的所有属性。它具备了这种新型计算机操作系统的一切特性。它负责管理资源。它负责调度,进行调度工作,处理 I.O.,并且它还负责网络连接。它具备了基础计算机的所有特性。明白了吗?所以你可以看到,红线指的不是也不是 y 轴。红线代表的是它的增长。这才是最非同寻常的事情。

因此,现在世界上每一家公司都需要思考:你们的 Open Source 策略是什么?每一家软件公司,每一家,每一家公司都需要拥有一个 Open Source 策略。我们曾经都有自己的 Linux 策略一样,我们都必须拥有互联网策略一样,曾经思考你们的移动云策略是什么一样。现在的问题是,你们的 Open Source 策略是什么。这是一个非常重大的事项。


路线图更新:Blackwell 与 Rubin 的万亿需求

黄仁勋: 接下来,我针对我在这里所说的话做进一步的回答。首先,一年前,我曾表示我们对 Blackwell 和 Rubin 在 2026 年前的出货量有着 5000 亿美元的明确预期。总之,在2025年的某个月份,我曾说过我们对 Blackwell 和 Rubin 的需求有着清晰的预见,包括需求订单和采购订单,是非常明确的5000亿美元的需求。你们当中有许多人提出了很多问题,比如,我们现在进展到什么阶段了?你们希望了解我们目前的最新进展。

所以我考虑给各位做一个更新。我们目前所处的节点,现在是几月?作为记录,现在是3月。所以我们正处于3月。3月。距离2027年结束还有很长一段时间。我首先想让各位明确这一点。然而,由于我们正在建设基础设施和工厂,且每个人的交付周期都很长,他们希望确保尽早向我们提供确定的需求或采购订单,以确保其供应,明白吗?

因此,我们对超过1万亿美元的可视化需求充满信心,请注意,这可不是一个浮点数,各位,明白吗?它也不需要精确到94位数字,明白吗?而且我们计算的不是几美分。你可以保持你的理智。然而,我们对超过1万亿美元的 Blackwell 和 Rubin 市场规模有着清晰的预见。之所以只提到 Blackwell 和 Rubin,而不包括我们销售的其他所有产品,是因为我参考了去年当时我只谈论 Blackwell 和 Rubin 的情况。这听起来不合理吗?

提问者: 去年我们还没有 Groq。去年我们也没有单独销售 standalone CPU。

黄仁勋: 去年我们还没有现在需要销售的许多产品。因此,如果我今天把这些产品包含进去是不合理的,但这并不是因为我们昨天没有这些东西。这听起来不合理吗?有人点个头,我就可以继续了。

因此,有几点情况。这只是 Blackwell 和 Rubin。这还不够好。这不是 Rubin Plus,也不是 Rubin Ultra。它不是这些东西中的任何一个。它不是独立的 Vera。

主持人: 它不是 Groq。是 Blackwell 加 Rubin。

黄仁勋: 我们有高度的信心、强大的可见度、需求、预测,以及超过一万亿美元的采购订单。

主持人: 我们经常在出货时就完成了交易,而且我们预计也会如此。

黄仁勋: 我们确实预计如此。从现在到 2027 年底,我们将完成并交付更多的业务。我们预计从现在到 2027 年,在此基础上将完成、记录并交付更多的业务。之所以如此,是因为我们预计从现在到 2027 年底,我们依然会持续开展工作。

与众不同的是,由于我们构建并完成了这种质量的系统,我们确实能够在同一个季度内赢得、预订并交付新的业务。当然,如果你必须构建 ASIC 或者类似的东西,显然是无法做到这一点的。如果你现在还没有看到这一点,那么到 2027 年底你就无法完成交付。但这对于我们来说并非如此。我们建立了库存。我们拥有充足的供应渠道,并且我们必须利用这一点。


Token 生产的经济学:效率、价值与定价

主持人: 我们必须照顾那些突然出现的客户,因为他们急需更多的算力。

黄仁勋: 这有道理吗?因此,当他们急需更多算力,并且突然在最后一天说:天哪,我确实需要更多。我希望能够回答,而且我们总是处于能够回答的状态:我们非常乐意为您提供帮助。我们也在开拓新客户、新市场和新地区,这些尚未计入此处,因为我们还有大约 21 个月的时间。明白吗?我希望你们理解那 1 万亿美元的规模,根据定义,它将持续增长。根据定义,因为它所对比的对象在不断增长,所以它最终会比这个数字更大。

我还想补充几点,去年是非常好的一年,因为 2025 年是我们的推理之年,我们帮助大家理解了计算机的价格与 Token 的成本,这两者之间仅存在微弱的关联。计算机的价格与 Token 的成本。记住,人们购买这些计算机是为了生产 Token。这些 Token 生产的效率至关重要。他们并不是在转售这些计算机。如果你购买了一台计算机,它很昂贵,如果你只是把它转售出去,那它确实显得昂贵。但你买了一台电脑,而且它很昂贵。

主持人: 但你买了一台电脑,而且它很昂贵。

黄仁勋: 因为这项技术令人难以置信,但它生成 token 的速度也非常惊人。你同时购买了最昂贵的电脑,并生成了成本最低的 token。这难道不合理吗?这就是我们每天在做的事情。这就是我们的工作。这正是我们能够交付价值的原因,我们在这里交付的价值差异,即我刚才描述的两个数字,就是我们能够确保毛利率的方式。

我们必须交付,并且我们始终交付远超预期的价值,也就是每秒 token 生成量,即单位功耗下的每秒 token 生成量。我们每一代产品都交付了远超以往的价值,以至于客户宁愿以更高的价格购买我们的下一代产品,也不愿购买价格更低的当前一代产品。他们更倾向于即时转换。当 Vera Rubin 问世时,安装 Vera Rubin 比继续购买 Grace Blackwell 更明智。你们听懂了吗?有人点个头。明白了吗?因为即使价格更高,其价值也更优越。

所以我正在对比这两个系统,因为它们是目前世界上两大系统,在你能超越这两个系统之前,购买其他产品毫无意义。

主持人: 而且这两个系统极难被超越,因为摩尔定律无法带来 35 倍的性能提升。

黄仁勋: 所以仅靠摩尔定律是行不通的。制造更快的芯片也无济于事。你必须构建一个更快速、集成大量芯片的系统。去年也就是 2025 年是我们的推理之年,我们已经展示了在推理领域的领先地位。

主持人: 训练,从训练后阶段到现在的推理。

黄仁勋: 去年我们还做了一些非常棒的事情,那就是我们扩大了覆盖范围,增加了支持我们平台的 AI 数量。去年,即 2025 年,我们将 Anthropic 加入了我们的平台,这是全新的增长。我们增加了 Meta Llama,这也是全新的增长。我们仍在与 Meta 在其他所有事务上进行合作。Meta Llama 是一个全新的实体,他们有全新的计算需求。

我们都可以承认,去年开源软件和开源模型实现了腾飞。以至于 API 推理服务提供商现在发现,开源模型大约已成为第二大主流 AI 模型。这意味着,按生成的 token 总数计算,第一名当然是 OpenAI。综合来看,开源模型位列第二。Nvidia 是全球开放模型领域的最佳平台。我们是各地开放模型的事实标准。因此,第一是 OpenAI,第二是所有各类开放模型。第三是 Anthropic,第四是 xAI。只需列出你的清单,继续推进即可。


全栈平台与生态系统影响力

主持人: NVIDIA 去年覆盖的模型数量大幅增加,这解释了我们在庞大基数下依然保持加速增长的原因。

黄仁勋: 我们已经是一家体量巨大的公司,而现在我们的增长速度正在进一步加快。

主持人: 总之,这就是我的看法。

黄仁勋: 最后一点。我们珍视我们的超大规模计算合作伙伴,并与他们保持着非常紧密的合作。但必须明确一点,我们与超大规模计算厂商的关系不仅限于向他们销售产品。我们为他们吸引客户。

在他们的云端提供 CUDA 能够吸引所有的 CUDA 开发者、所有的 AI 原生企业,以及我们合作的所有大型公司。每当我们为这些大型或小型公司提供加速服务时,我们就将他们引入并落地,让他们托管在各家全球 CSP 中。我们是全球 CSP 最好的销售力量之一。

主持人: 这就是为什么如果你走到展会现场,会发现他们都设有最大的展位。

黄仁勋: AWS 在这里设有最大的展位。Google Cloud 在这里设有最大的展位。Azure 在这里设有最大的展位。Oracle 有巨大的展位,CoreWeave 在这里也有很大的展位。这难道不合理吗?因为我们为他们带来了客户。他们为什么会在这里?与我的开发者交流,向我的开发者销售产品。

而我们所有的开发者只知道如何编写一种程序。他们只知道如何编写 CUDA 程序,并且只使用 CUDA-X 库。当我们获胜并帮助这些开发者集成 Nvidia 时,他们就会落户于我们的 CSP 合作伙伴平台。我们是 CSP 最好的销售团队之一。

主持人: 好的。

黄仁勋: 然而,我们也看到 CSP 之外的客户呈现出巨大的多样性。区域性云服务商、工业、企业内部部署,当 Dell、Lenovo 和 HP 的业务增长如此迅速,且所有 ODM 的增长也如此迅速时,那 40% 的业务(即图表右侧部分)中,有很大一部分来自这里。大多数人只看到我们左侧 60% 的业务。

如果缺少 Nvidia 的全栈技术,缺少我们整体架构的能力(即我们能够为您构建整个 AI 工厂),以及全球所有开放平台都运行在 Nvidia 之上,你就完全无法触及那 40% 的市场。所以,总结一下。这张图表所表达的即是如此。

主持人: 那 60% 中很大一部分是 NVIDIA 开发者在云端落地。

黄仁勋: 如果没有全栈技术,没有端到端的支持,那 40% 的 100% 是不可能实现的。我表达清楚了吗?理解我们的业务非常重要。我们将这一切统称为加速计算,这可能对你们来说表述不够精准。所以明年,我们将以一种不同的方式进行拆分。

未来我们将以一种不同的方式进行拆分,看起来可能这张图表一样。届时你们会在那 60% 的份额中看到诸如超大规模云厂商之类的内容。即便你看到了这一点,也要记住,我们带给云端的客户中有很多都是如此。

主持人: 再看右侧,如果你仅仅是制造芯片,那么那40%是绝对不可能实现的。因为他们不买芯片。他们买的是平台。三条信息,全都挤在一张幻灯片上,这可能让你大脑超载了。

黄仁勋: 所以我又重申了一遍。这样有帮助吗?我本应该做三个板块或三张幻灯片。

主持人: 本应该做三个板块或三张幻灯片。那样也就一秒钟的事。

黄仁勋: 那本来会是一秒钟的事。七小时的主题演讲。但那是值得的。


问答环节:现金流、估值与智能体增长

主持人: 好了,就这样。谢谢。提问环节。我们现在开始接受提问。

Ben Wright: 你好。我是 Amelia’s Research 的 Ben Wright。感谢邀请我们参加这次活动。你们提供的这种接触机会非常难得。祝贺你和你的团队取得这些成就。这太棒了。Jensen,昨晚我们拍照的时候,顺便说一下,大家还可以去点赞那张照片。我需要打破去年的记录。

黄仁勋: 什么照片?

Ben Wright: 我们快速拍了一张照片,我已经发布了,我正努力超越去年的点赞数。

黄仁勋: 好的。

Ben Wright: 好吧。

黄仁勋: 我当时有没有处于什么尴尬的姿势之类的?

Ben Wright: 我们可以这样说。相机让我看起来胖了10磅,但你却没有。我不知道那是如何运作的。你看起来很棒。

所以我答应过要问你一个关于推理的问题,这与此相关。这太棒了。这里很多人都明白这一点。我们遇到的主要阻力是:这是否值得投入?超大规模云服务商(hyperscalers)在API和云业务上的收入增长是否足以证明所有这些支出是合理的?

Jensen 看到了什么?我对这些超大规模云服务商有预估,我也说过他们的收入有上涨空间,但目前资本开支(CAPEX)比他们的云业务高出20%。以及 API 收入。我想知道你看到了什么。您过去曾提到,来自客户——尤其是超大规模云服务商(hyperscalers),以及那些服务于 Anthropic 和 OpenAI 的客户——的现金流有巨大的增长空间。那么,我们何时才能调高对这些业务的预期?

我知道这对您来说是个棘手的问题,因为您同时还要为其他三、四或五家公司提供指引,但如果我们能看到这种上行潜力,相信您的股票表现会好得多,因为届时我们将意识到这种基础设施建设能够持续下去。那么,这个转折点究竟在何时?我们确实看到了转折,但它的具体时间点在哪?您认为他们的收入增长潜力有多大?以及我们该如何对这一点更有信心?

主持人: 我真希望那些公司是上市公司。

黄仁勋: 原因在于,如果它们上市,你们就能看到我所看到的一切。历史上没有任何一家公司。

主持人: 曾作为一家初创公司,一家非上市公司,实现过每周增加十亿或二十亿美元的收入增长。

黄仁勋: 这就是他们目前正在经历的增长速度。

主持人: 记住,我刚才强调的是‘每周’。

黄仁勋: 整个IT软件行业的规模约为2万亿美元。

主持人: 不相信这2万亿美元规模的行业会被颠覆。相信它会被转型。相信那2万亿美元的IT行业中的每一家,都将整合OpenAI、Anthropic以及各种开源模型。

黄仁勋: 并将它们与名为 Open Source 的开源软件连接起来,我们将其转化为了企业级版本 NeMo,这样你就能立即获得一个智能体。已有150万人下载了 Open Source 并构建了自己的智能体。只需要一行代码。然后你告诉智能体去完成它自身的构建。如果你不知道这个东西,那就去学习它。于是它就开始执行和学习了。明白吗?

因此,在未来,这些智能体将被整合到 IT 行业中。当前的 IT 行业拥有 2 万亿美元的软件许可规模。它可能会变成,让我随便选个数字,8 万亿美元,同时也会转售大量的 token。全球 100% 的 IT 行业都将成为 OpenAI 和 Anthropic 的转售商。你们跟得上我的思路吗?没有吗?提高你们对 OpenAI 和 Anthropic 的估值吧。

相信 Anthropic 和 OpenAI,当然还有所有的 IT 公司,也会利用开源模型来修改和定制他们自己的软件及模型。这就是 Nemotron 的用途,也是 NeMo 的用途,我们创造了所有的工具,这也是我们与他们所有人合作的原因。他们都将创造出整合了这三个组件的智能体。相信这一点。它们将实现惊人的增长。这一时刻终将到来。而且很快就会到来。

其原因在于,你可以从 Anthropic 的数据中看出来。你也可以从 OpenAI 的数据中看出来。它们的发展速度不是常态,它们在一个月内增长的规模相当于整个 IT 公司的体量。

主持人: 这些 AI 公司的营收,其 AI 不仅会被企业直接使用,而且将具备可分销性。

黄仁勋: 通过 IT 公司进行销售,并集成到 IT 公司之中。这听起来合理吗?因为只要想想 AI 本质上就是软件而已。

主持人: 他们的软件将直接提供给企业,同时也会被整合,变得更具领域针对性、专业化,并具备治理、安全、易于配置的特性,且能连接到企业的记录系统等等。

黄仁勋: 这将会形成一个整体的,代理式系统(agentic system)。这些系统将出租给客户,但客户仍然必须通过工厂(factories)来消耗 token。所以,如果这是通过 OpenAI 实现的,那当然很好。如果是通过 Anthropic 实现的,那也很棒。如果是通过开放模型实现的,那同样没问题。但它们都需要生成 token。

所以总而言之,过去的技术公司是授权软件,而未来的技术公司将出租 token、生成 token。你们听明白了吗?它们的商业模式将会发生改变。这些公司将会变得规模更大。它们的毛利率将会发生改变。毛利率概况将会发生改变,因为它们的商业模式中现在有了 token,有了销售成本(COGS),但它们也提供了更大、多得多的价值。所以这对它们来说令人兴奋,非常、非常令人兴奋。

主持人: 好的。很好。

黄仁勋: 把麦克风从这个 8 万亿美元的环节传递过去。

主持人: 谢谢。


物理 AI 与工业边缘端的未来

C.J. Muce: 早上好,C.J. Muce,来自 Cantor Fitzgerald。感谢你们举办这次活动。非常感谢。或许可以跟进一下 Ben 提出的问题。并思考一下这张 60-40 图表的演变。

你提到了 NeMo,昨天又宣布了 Vera Rubin DGX AI Factory 参考设计,这本质上是为你们的非超大规模客户提供未来的蓝图。与超大规模云服务商展开竞争。所以我很好奇,当你们将这一切整合在一起时,你们看到了 Token 生成量的巨大激增,你们预计这张图表随时间将如何演变,以及我们应该如何看待其中不同参与者的相对增长向量。

黄仁勋: 这张图表的两侧都在以大致相同的速率增长,直到几年后物理 AI 出现转折点。假设物理 AI 出现了转折点,那么工业侧的计算就必须在本地完成。必须在边缘端完成。必须在实地完成。这必须在工厂内完成。然后突然之间,那 40% 的比例很可能会增长。最终,那 40% 会变得更大。

主持人: 原因在于,全球与物理 AI 相关的产业规模要远大于与数字 AI 相关的产业。全球约有 70 万亿美元的产业,大概 50、60 或 70 万亿美元的规模,都需要物理 AI。

黄仁勋: 因为世界并不是发生在我们的笔记本电脑里。世界发生在它原本存在的地方。因此,有许多与原子相关的业务,如果离开物理 AI 将无法处理。所以相信并希望那 40% 的比例能达到 70%。这两者都将变得极其庞大。因为世界每天都会持续不断地产生 Token。它不会停止。

就在我们交谈的此时此刻,我们所有的笔记本电脑,希望你们大多数人的笔记本电脑,都处于某种闲置状态。但在未来,计算机将全天候 24-7 运行并生成 token,因为你们的智能体正在后台执行任务。有人,我在 Reddit 上看到的一篇帖子提到,某人的某个工具一天消耗了 5000 万个 token。这听起来很多,但只有 50 美元。

主持人: 如果你的智能体在做有成效的工作,花费 50 美元,并不算坏。所以,你可以让一个每天创造数千美元价值的人,通过运行一大堆每天花费 50 美元 token 的智能体,变得更加高效。

黄仁勋: 这将成为常态。就在此时此刻,我在 Nvidia 内部就已经在使用它们了。我希望我每天支付数千美元薪资的员工,能消耗超过 50 美元 token 的资源。你疯了吗?我希望你能管理一整支智能体舰队来完成你的工作。所以,我真心希望那些每天能赚 2,000 美元的人,每天能花掉 1,000 美元的 Token。而且,我刚才所说的合乎逻辑。这终将发生。

主持人: 而且这已经在发生了。这已经在世界各地的软件公司中发生着。


推理市场细分:从免费级到极致性能

Stacey Razgan: 大家好。我是来自 Bernstein 的 Stacey Razgan。感谢你回答我的提问。我有一个简短的问题想向 Colette 确认,然后 Jensen,我有一个问题想请教你。Colette,确认一下,提到过 Rubin 将在下半年实现产能爬坡。Groq 听起来要在第三季度发布,那么 Rubin 应该和 Groq 一起发布,我的理解因为 Groq 不太可能独立发布。

接下来是 Jensen,我想问你一个更长远的问题。我很喜欢你前几天展示的那张图表。它几乎展示了推理谱系的某种扩展,而这正是推动 Groq 价值增长的动力。你过去常说 GPU 是必然的选择。我们现在看到,随着推理谱系的拓宽和低延迟变得越来越重要,Groq 这样的架构被证明是必需的。

我想问的是。你认为这个谱系今后将如何演变?随着我们在未来几年甚至更久的时间里不断前行

AGENT3,11%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar