先看Agentic AI为什么对CPU需求完全不同于传统LLM。LLM时代的工作负载映射在大规模并行矩阵运算上，GPU天然契合，CSP训练集群的GPU:CPU比从2020年的3:1一路拉到2024年的8:1。但Agentic AI的计算结构完全不一样。Agent编排、工具调用、上下文窗口管理、多Agent协调、人机交互回路，这些全是通用顺序处理，要求低时延和高内存带宽，都是CPU的活。GPU的工作退缩到token生成本身，其余一切回归CPU。Bernstein给出的数据是GPU:CPU比到2030年反转到2:1，CPU在推理集群AI capex中的占比从14%升至50%。
AMD自己在2025年11月分析师日给的CPU TAM预期是600亿美金，半年后2026年Q1财报电话会翻倍到1200亿。Intel连此前减值报废的库存芯片都能卖掉，客户抢着要。供需紧张程度可见一斑。
中国的x86服务器CPU TAM从2025年的70亿美金到2030年的270亿美金，但增长节奏分两个阶段。2025到2028年CAGR约31%，低于全球的35%，原因是双重供给约束。一方面AMD和Intel的产能被美国超大规模客户优先吸收，分配给中国的份额在缩减。另一方面SMIC先进制程产能有限，既限制了国产AI加速卡的放量（AI加速卡供应不足直接压制CPU的配套需求），也限制了海光自身的晶圆分配。2028年之后这两个约束同时松动。SMIC及其他国内代工厂的先进节点产能规模化释放，国产AI芯片供应上量带动服务器整体部署加速，叠加地方政府主导的AIDC投资追赶，中国CPU市场CAGR升至36%，开始跑赢全球。
海光的技术代际演进值得细看。2016年通过AMD Zen1授权起步，2019年被列入实体清单后失去AMD后续技术支持，但Zen1的IP授权本身不可被追溯撤销。从Gen2到G4，海光在14nm（后转SMIC N+1/10nm等效）的制程约束下，通过架构、内存子系统和I/O的自主改进，每代实现30-50%的性能提升。G4已经做到64核、DDR5、PCIe5.0，SPEC2017 int-rate得分大约1000，对标Intel Xeon四代/五代（2022-2023年产品）和AMD Zen3（2021年产品），技术差距稳定在2-3年。一个有意思的侧面验证是今年曝出的StackWarp硬件漏洞影响了多代AMD Zen处理器，海光完全不受影响，原因是其安全架构已经从AMD的SEV-SNP替换为自研的CSV3。这说明微架构层面的分叉是真实的，不是换皮。
G5是整个增长逻辑的承重点。128核、512线程（SMT4）、16通道DDR5、CXL2.0，全自研微架构，预计在SMIC N+2（7nm等效）上制造。Bernstein估计SPEC2017 int-rate得分能到2000以上，而Intel Granite Rapids（128 P核，2024年9月上市）得分2440，AMD Zen5（2024年）得分2089。如果G5按计划出来，海光跟全球最新产品的差距就从现在的"差两代"缩小到"差一代"。
128核的可行性不依赖制程突破，依赖chiplet封装。不上单片128核的巨型die（良率会崩），而是把多个较小的compute chiplet拼在一起，这是AMD EPYC从Zen2开始用的路线。在SMIC 7nm等效节点上做较小面积的计算die，良率可控，总核心数取决于封装多少块die。IPC的+17%提升来自从Gen2到G4积累的四代全流程设计经验加上国产EDA工具在7nm数字逻辑综合上的成熟。16通道DDR5则依赖长鑫存储的DDR5产能扩张和澜起科技的CXL控制器IP。三个条件中，SMIC的7nm产能分配是最硬的瓶颈。
海光G5真正差异化的点在SMT4。512线程/每socket，这在当前所有服务器CPU里是最高水平。AMD和Intel的主流产品是SMT2。SMT4在什么场景有优势？多租户推理服务（逻辑CPU密度翻倍，单位推理请求成本下降）、Agentic AI的编排层（大量I/O-bound和memory-bound的轻量线程）、以及内存受限的LLM推理（线程在等KV-cache数据时其他线程能利用执行单元）。这恰好是中国市场未来最大的增量场景。中国在推理侧有结构性优势，电力成本低加上DeepSeek等厂商展示的LLM推理优化能力，意味着同样算力下token产出更高。如果中国数据中心的CPU:GPU配比因此高于美国，那CPU需求的上行空间比Bernstein的base case还要大。
Bernstein给海光的市占率预测是按价值从2025年的19%到2030年的36%，按出货量接近50%（因ASP低于Intel/AMD）。逻辑分两步。第一步是信创存量需求的持续消化，这是政策驱动的底仓，不依赖性能绝对值。第二步是2027年之后CSP的商业化采购启动，这才是增量的大头。CSP客群到2030年会占中国x86服务器部署的约75%。海光在这个市场从目前的中个位数渗透率做到20%，需要G5的性能足够用，同时AMD/Intel的供应持续偏紧。海光还有一个独特杠杆，CPU+DCU（AI加速卡）的全栈捆绑。在国产AI芯片供应紧张期，海光可以用DCU的分配权换CPU的采购量，反之亦然。除华为外没有第二家能这么做。
整套逻辑成立与否，供给侧取决于SMIC先进节点的产能爬坡能不能支撑G5持续放量，需求侧取决于CSP客户的实测验收。G5在6月已确认量产出货，配套服务器从风冷双路到浸没式液冷（单组80,000+核心）都有了，但目前没有任何独立的SPEC跑分公开数据。2000分是Bernstein的估算，不是实测。CSP大规模采购需要POC验证周期，从送样到资质认证到批量上架通常两到三个季度。看看下半年是否有头部CSP的集采订单落地。

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

请输入评论内容

暂无评论

热门话题
查看更多
#
gStocks代币化股票上线
475.86万热度
#
非农爆冷打压加息预期
104.66万热度
#
预测世界杯巴西VS挪威
20.16万热度
#
ETH突破1700
1.52亿热度
#
Meta卖算力引发存储股大跌
139.56万热度

置顶

热门话题

gStocks代币化股票上线

非农爆冷打压加息预期

预测世界杯巴西VS挪威

ETH突破1700

Meta卖算力引发存储股大跌

置顶