📢 Gate 广场认证创作者招募中,入驻瓜分每月 $20,000 创作大奖!
📌 参与方式
站内创作者: 成功申请“创作者认证徽章”即可自动参与。
新入驻创作者: 需填写入驻表单申请 👉️ https://www.gate.com/questionnaire/7698
🎁 创作者福利
1️⃣ 首帖见面礼: 新入驻/回归创作者发首帖,即得 $50U 奖励!
2️⃣ 周度发帖奖: 完成周发帖任务,轻松瓜分 $10,000 奖池!
3️⃣ 月度创作奖: 赛道更多样,完成月度任务瓜分 $1,600 GT 奖池!
4️⃣ 专属推广任务:进入专属创作者社群,享专属推广任务和节日礼包!
让您的优质内容被更多人看到,携手共建高质量创作者社区!
活动细节:https://www.gate.com/announcements/article/51536
GPU 让英伟达成为历史上最有价值的公司。
取代它的芯片已经由谷歌、亚马逊、Meta、微软和OpenAI同时在建造。
这意味着资金的实际流向接下来会发生什么。
首先,你需要理解为什么GPU会成为王者。
回到2012年。
一个名为AlexNet的神经网络在全球图像识别比赛中凭借一个洞察力击败了所有竞争对手。
英伟达在GPU中构建的并行处理能力,用于渲染逼真的视频游戏图形,其结构与训练神经网络所需的完全相同。
成千上万的较小核心同时执行矩阵乘法,而不是少数强大的核心依次运行任务。
一位研究员利用GPU进行破解,暴露出其深度学习的并行计算能力。
那一刻开启了长达十年的发展,使英伟达从一家游戏公司转变为整个AI经济的基础设施层。
仅去年就出货了六百万块Blackwell GPU。
一台72-GPU的Blackwell服务器机架售价约300万美元。
英伟达每周出货一千台。
在十月的短暂时刻,英伟达成为历史上首个市值达到5万亿美元的公司。
这就是2012年一个洞察力的复合结果。
但GPU存在一个结构性问题,直到最近没人大声谈论。
它是一把瑞士军刀。
在广泛的AI工作负载中极其强大,但并未针对任何单一任务进行优化。
在大型语言模型的早期繁荣时期,这种灵活性是重点。
训练需要大量的通用并行计算,GPU比任何其他可用设备都更好地提供了这种能力。
但随着模型的成熟,平衡开始发生变化。
后训练技术使模型变得越来越强大。
现在的主要工作负载不再是训练。
而是推理。
每次你打开Claude、ChatGPT、Gemini或任何AI产品并收到回应时,那就是推理。
每一次星巴克应用交易、每一次Salesforce工作流、每一个在你的耳机中运行的AI助手。
全部是推理。
而推理可以在性能较低、为更特定任务编程的芯片上运行。
这一工作负载平衡的单一转变,为现在正在建造以挑战英伟达主导地位的芯片打开了大门。
ASIC是改变格局的芯片。
应用特定集成电路。
GPU像是一把瑞士军刀,而ASIC则是单一用途的工具。
硬连线执行某一类型任务的精确数学运算。
在该任务上更快、更节能,且在规模操作中比任何通用GPU都便宜得多。
权衡是灵活性。
一旦硅片上刻蚀,ASIC就无法重新编程以适应不同的工作负载。
但对于每天处理数十亿请求的公司来说,这个权衡并不是劣势。
正是这个点。
谷歌率先推出了TPU,张量处理单元,2015年发布,并帮助推动了2017年变换器架构的发明。
变换器几乎是当今所有现代AI系统的基础。
谷歌的第七代芯片Ironwood刚刚推出,并签订了用多达一百万TPU训练Claude的协议。
亚马逊在2015年收购以色列芯片创业公司后,开发了Trainium和Inferentia。
Anthropic目前在印第安纳州的亚马逊数据中心用五十万块Trainium2芯片训练模型,那里没有英伟达GPU。
根据亚马逊自己的数据,Trainium在价格性能比方面比竞争硬件供应商高出30%到40%。
Meta拥有自己的训练和推理加速器。
微软推出了面向Azure数据中心的Maia芯片。
OpenAI从2026年开始与博通合作打造定制ASIC。
每个主要的超大规模云服务商都在同时打造自己的芯片。
不是作为实验。
而是作为价值数百亿美元的战略基础设施决策。
博通是大多数人未在其论点中考虑到的公司。
每个拥有ASIC项目的超大规模云服务商都至少与一家芯片设计公司合作,获取IP、工程专业知识,以及连接芯片的网络基础设施。
博通在该市场占据主导地位。
谷歌的TPU、Meta的训练加速器、现在的OpenAI定制ASIC。
追踪这一领域的分析师估计,博通在定制ASIC后端市场占有70%到80%的份额。
预计未来五年,该市场将以中双位数的复合年增长率增长。
ASIC浪潮的增长速度超过GPU市场。
博通几乎掌控了其中的全部。
然后是大多数人尚未关注的边缘层。
随着数据中心AI的成熟,下一场战场是设备端推理。
你的手机。你的汽车。你的笔记本。你的可穿戴设备。
神经处理单元(NPU)是支持AI本地运行的芯片,无需将数据发送回云端。
隐私、速度和成本效率在推理在设备上运行时都得到提升。
高通在Android的NPUs领域占据主导。
苹果的M系列芯片包括专用的神经引擎,用于MacBook。
最新iPhone中的A系列芯片内置神经加速器。
AMD和英特尔在Windows笔记本中竞争NPU。
目前,资金主要集中在数据中心。
但将AI普及到每一部手机、每一辆车、每个机器人和可穿戴设备所需的芯片数量,比数据中心市场大出一个数量级。
这一转变已经开始。
所有这些背后的地缘政治层面,是几乎没有人在消费者叙事中充分讨论的限制。
几乎这个生态系统中的每一块芯片——英伟达Blackwell、谷歌TPU、亚马逊Trainium、苹果A系列——都由一家公司制造。
台积电(TSMC)。
台湾先进制程半导体制造的集中度,是全球AI竞赛中最大的地缘政治瓶颈。
CHIPS法案启动了在亚利桑那州建造台积电工厂的进程。
英伟达的Blackwell已在亚利桑那工厂全面投产。
英特尔也在亚利桑那新建的工厂制造先进制程芯片。
但苹果最新的iPhone芯片仍然依赖台积电的三纳米工艺,目前只有台湾有。
将半导体制造回迁到美国的进程正在进行,但时间以年计,而非月。
中国也在建设自己的平行产业链。
华为、字节跳动和阿里巴巴都在开发定制ASIC,受到出口管制限制,限制了它们获取最先进设备和英伟达Blackwell芯片的能力。
AI芯片竞赛不仅仅是技术竞争。
它是一场在硅片上的地缘政治基础设施战争。
获得最先进制造能力和最可靠电力供应的国家,将赢得远比市场更宝贵的东西。
这里是将所有内容联系在一起的框架。
英伟达之所以能占据领先地位,是因为多年的开发者生态系统投资、CUDA作为专有软件护城河,以及始终领先的硬件路线图,构建了历史上最持久的竞争优势之一。
这个优势不会一夜之间消失。
但市场规模如此庞大,为英伟达之外的全新一层赢家提供了空间,而不是简单取代它。
超大规模云服务商通过定制ASIC减少对英伟达的依赖。
博通同时掌控每个主要ASIC项目的后端基础设施。
高通和苹果掌握边缘推理层,随着AI进入每个设备。
台积电仍然是不可替代的制造瓶颈,无论哪种芯片架构获胜。
而在所有这些之下,支撑一切的电力基础设施成为决定谁能以AI竞赛所需速度建造的限制因素。
GPU让英伟达成为历史上最有价值的公司。
那些在2012年之前就理解这一点的人,从未需要解释他们的时机。
而在ASIC转型中,同样存在着洞察差距。
关注模型竞赛底层芯片层的人已经布局。
今晚采取行动的人,将理解明天的意义。