广场
最新
热门
资讯
我的主页
发布
农场跳跃者
2026-07-04 03:57:08
关注
Bernstein昨天给海光信息的目标价从280元上调至450元,核心逻辑是Agentic AI正在颠覆过去四年"GPU独占AI capex"的格局,CPU的角色从配角回到主角。全球服务器CPU TAM从2025年的390亿美金膨胀到2030年的2230亿美金,六倍。海光作为全球唯一Intel/AMD之外的x86服务器CPU供应商,是这个结构性转向里最直接的中国受益标的。
先看Agentic AI为什么对CPU需求完全不同于传统LLM。LLM时代的工作负载映射在大规模并行矩阵运算上,GPU天然契合,CSP训练集群的GPU:CPU比从2020年的3:1一路拉到2024年的8:1。但Agentic AI的计算结构完全不一样。Agent编排、工具调用、上下文窗口管理、多Agent协调、人机交互回路,这些全是通用顺序处理,要求低时延和高内存带宽,都是CPU的活。GPU的工作退缩到token生成本身,其余一切回归CPU。Bernstein给出的数据是GPU:CPU比到2030年反转到2:1,CPU在推理集群AI capex中的占比从14%升至50%。
AMD自己在2025年11月分析师日给的CPU TAM预期是600亿美金,半年后2026年Q1财报电话会翻倍到1200亿。Intel连此前减值报废的库存芯片都能卖掉,客户抢着要。供需紧张程度可见一斑。
中国的x86服务器CPU TAM从2025年的70亿美金到2030年的270亿美金,但增长节奏分两个阶段。2025到2028年CAGR约31%,低于全球的35%,原因是双重供给约束。一方面AMD和Intel的产能被美国超大规模客户优先吸收,分配给中国的份额在缩减。另一方面SMIC先进制程产能有限,既限制了国产AI加速卡的放量(AI加速卡供应不足直接压制CPU的配套需求),也限制了海光自身的晶圆分配。2028年之后这两个约束同时松动。SMIC及其他国内代工厂的先进节点产能规模化释放,国产AI芯片供应上量带动服务器整体部署加速,叠加地方政府主导的AIDC投资追赶,中国CPU市场CAGR升至36%,开始跑赢全球。
海光的技术代际演进值得细看。2016年通过AMD Zen1授权起步,2019年被列入实体清单后失去AMD后续技术支持,但Zen1的IP授权本身不可被追溯撤销。从Gen2到G4,海光在14nm(后转SMIC N+1/10nm等效)的制程约束下,通过架构、内存子系统和I/O的自主改进,每代实现30-50%的性能提升。G4已经做到64核、DDR5、PCIe5.0,SPEC2017 int-rate得分大约1000,对标Intel Xeon四代/五代(2022-2023年产品)和AMD Zen3(2021年产品),技术差距稳定在2-3年。一个有意思的侧面验证是今年曝出的StackWarp硬件漏洞影响了多代AMD Zen处理器,海光完全不受影响,原因是其安全架构已经从AMD的SEV-SNP替换为自研的CSV3。这说明微架构层面的分叉是真实的,不是换皮。
G5是整个增长逻辑的承重点。128核、512线程(SMT4)、16通道DDR5、CXL2.0,全自研微架构,预计在SMIC N+2(7nm等效)上制造。Bernstein估计SPEC2017 int-rate得分能到2000以上,而Intel Granite Rapids(128 P核,2024年9月上市)得分2440,AMD Zen5(2024年)得分2089。如果G5按计划出来,海光跟全球最新产品的差距就从现在的"差两代"缩小到"差一代"。
128核的可行性不依赖制程突破,依赖chiplet封装。不上单片128核的巨型die(良率会崩),而是把多个较小的compute chiplet拼在一起,这是AMD EPYC从Zen2开始用的路线。在SMIC 7nm等效节点上做较小面积的计算die,良率可控,总核心数取决于封装多少块die。IPC的+17%提升来自从Gen2到G4积累的四代全流程设计经验加上国产EDA工具在7nm数字逻辑综合上的成熟。16通道DDR5则依赖长鑫存储的DDR5产能扩张和澜起科技的CXL控制器IP。三个条件中,SMIC的7nm产能分配是最硬的瓶颈。
海光G5真正差异化的点在SMT4。512线程/每socket,这在当前所有服务器CPU里是最高水平。AMD和Intel的主流产品是SMT2。SMT4在什么场景有优势?多租户推理服务(逻辑CPU密度翻倍,单位推理请求成本下降)、Agentic AI的编排层(大量I/O-bound和memory-bound的轻量线程)、以及内存受限的LLM推理(线程在等KV-cache数据时其他线程能利用执行单元)。这恰好是中国市场未来最大的增量场景。中国在推理侧有结构性优势,电力成本低加上DeepSeek等厂商展示的LLM推理优化能力,意味着同样算力下token产出更高。如果中国数据中心的CPU:GPU配比因此高于美国,那CPU需求的上行空间比Bernstein的base case还要大。
Bernstein给海光的市占率预测是按价值从2025年的19%到2030年的36%,按出货量接近50%(因ASP低于Intel/AMD)。逻辑分两步。第一步是信创存量需求的持续消化,这是政策驱动的底仓,不依赖性能绝对值。第二步是2027年之后CSP的商业化采购启动,这才是增量的大头。CSP客群到2030年会占中国x86服务器部署的约75%。海光在这个市场从目前的中个位数渗透率做到20%,需要G5的性能足够用,同时AMD/Intel的供应持续偏紧。海光还有一个独特杠杆,CPU+DCU(AI加速卡)的全栈捆绑。在国产AI芯片供应紧张期,海光可以用DCU的分配权换CPU的采购量,反之亦然。除华为外没有第二家能这么做。
整套逻辑成立与否,供给侧取决于SMIC先进节点的产能爬坡能不能支撑G5持续放量,需求侧取决于CSP客户的实测验收。G5在6月已确认量产出货,配套服务器从风冷双路到浸没式液冷(单组80,000+核心)都有了,但目前没有任何独立的SPEC跑分公开数据。2000分是Bernstein的估算,不是实测。CSP大规模采购需要POC验证周期,从送样到资质认证到批量上架通常两到三个季度。看看下半年是否有头部CSP的集采订单落地。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
请输入评论内容
请输入评论内容
评论
暂无评论
热门话题
查看更多
#
gStocks代币化股票上线
475.86万 热度
#
非农爆冷打压加息预期
104.66万 热度
#
预测世界杯巴西VS挪威
20.16万 热度
#
ETH突破1700
1.52亿 热度
#
Meta卖算力引发存储股大跌
139.56万 热度
置顶
网站地图
Bernstein昨天给海光信息的目标价从280元上调至450元,核心逻辑是Agentic AI正在颠覆过去四年"GPU独占AI capex"的格局,CPU的角色从配角回到主角。全球服务器CPU TAM从2025年的390亿美金膨胀到2030年的2230亿美金,六倍。海光作为全球唯一Intel/AMD之外的x86服务器CPU供应商,是这个结构性转向里最直接的中国受益标的。
先看Agentic AI为什么对CPU需求完全不同于传统LLM。LLM时代的工作负载映射在大规模并行矩阵运算上,GPU天然契合,CSP训练集群的GPU:CPU比从2020年的3:1一路拉到2024年的8:1。但Agentic AI的计算结构完全不一样。Agent编排、工具调用、上下文窗口管理、多Agent协调、人机交互回路,这些全是通用顺序处理,要求低时延和高内存带宽,都是CPU的活。GPU的工作退缩到token生成本身,其余一切回归CPU。Bernstein给出的数据是GPU:CPU比到2030年反转到2:1,CPU在推理集群AI capex中的占比从14%升至50%。
AMD自己在2025年11月分析师日给的CPU TAM预期是600亿美金,半年后2026年Q1财报电话会翻倍到1200亿。Intel连此前减值报废的库存芯片都能卖掉,客户抢着要。供需紧张程度可见一斑。
中国的x86服务器CPU TAM从2025年的70亿美金到2030年的270亿美金,但增长节奏分两个阶段。2025到2028年CAGR约31%,低于全球的35%,原因是双重供给约束。一方面AMD和Intel的产能被美国超大规模客户优先吸收,分配给中国的份额在缩减。另一方面SMIC先进制程产能有限,既限制了国产AI加速卡的放量(AI加速卡供应不足直接压制CPU的配套需求),也限制了海光自身的晶圆分配。2028年之后这两个约束同时松动。SMIC及其他国内代工厂的先进节点产能规模化释放,国产AI芯片供应上量带动服务器整体部署加速,叠加地方政府主导的AIDC投资追赶,中国CPU市场CAGR升至36%,开始跑赢全球。
海光的技术代际演进值得细看。2016年通过AMD Zen1授权起步,2019年被列入实体清单后失去AMD后续技术支持,但Zen1的IP授权本身不可被追溯撤销。从Gen2到G4,海光在14nm(后转SMIC N+1/10nm等效)的制程约束下,通过架构、内存子系统和I/O的自主改进,每代实现30-50%的性能提升。G4已经做到64核、DDR5、PCIe5.0,SPEC2017 int-rate得分大约1000,对标Intel Xeon四代/五代(2022-2023年产品)和AMD Zen3(2021年产品),技术差距稳定在2-3年。一个有意思的侧面验证是今年曝出的StackWarp硬件漏洞影响了多代AMD Zen处理器,海光完全不受影响,原因是其安全架构已经从AMD的SEV-SNP替换为自研的CSV3。这说明微架构层面的分叉是真实的,不是换皮。
G5是整个增长逻辑的承重点。128核、512线程(SMT4)、16通道DDR5、CXL2.0,全自研微架构,预计在SMIC N+2(7nm等效)上制造。Bernstein估计SPEC2017 int-rate得分能到2000以上,而Intel Granite Rapids(128 P核,2024年9月上市)得分2440,AMD Zen5(2024年)得分2089。如果G5按计划出来,海光跟全球最新产品的差距就从现在的"差两代"缩小到"差一代"。
128核的可行性不依赖制程突破,依赖chiplet封装。不上单片128核的巨型die(良率会崩),而是把多个较小的compute chiplet拼在一起,这是AMD EPYC从Zen2开始用的路线。在SMIC 7nm等效节点上做较小面积的计算die,良率可控,总核心数取决于封装多少块die。IPC的+17%提升来自从Gen2到G4积累的四代全流程设计经验加上国产EDA工具在7nm数字逻辑综合上的成熟。16通道DDR5则依赖长鑫存储的DDR5产能扩张和澜起科技的CXL控制器IP。三个条件中,SMIC的7nm产能分配是最硬的瓶颈。
海光G5真正差异化的点在SMT4。512线程/每socket,这在当前所有服务器CPU里是最高水平。AMD和Intel的主流产品是SMT2。SMT4在什么场景有优势?多租户推理服务(逻辑CPU密度翻倍,单位推理请求成本下降)、Agentic AI的编排层(大量I/O-bound和memory-bound的轻量线程)、以及内存受限的LLM推理(线程在等KV-cache数据时其他线程能利用执行单元)。这恰好是中国市场未来最大的增量场景。中国在推理侧有结构性优势,电力成本低加上DeepSeek等厂商展示的LLM推理优化能力,意味着同样算力下token产出更高。如果中国数据中心的CPU:GPU配比因此高于美国,那CPU需求的上行空间比Bernstein的base case还要大。
Bernstein给海光的市占率预测是按价值从2025年的19%到2030年的36%,按出货量接近50%(因ASP低于Intel/AMD)。逻辑分两步。第一步是信创存量需求的持续消化,这是政策驱动的底仓,不依赖性能绝对值。第二步是2027年之后CSP的商业化采购启动,这才是增量的大头。CSP客群到2030年会占中国x86服务器部署的约75%。海光在这个市场从目前的中个位数渗透率做到20%,需要G5的性能足够用,同时AMD/Intel的供应持续偏紧。海光还有一个独特杠杆,CPU+DCU(AI加速卡)的全栈捆绑。在国产AI芯片供应紧张期,海光可以用DCU的分配权换CPU的采购量,反之亦然。除华为外没有第二家能这么做。
整套逻辑成立与否,供给侧取决于SMIC先进节点的产能爬坡能不能支撑G5持续放量,需求侧取决于CSP客户的实测验收。G5在6月已确认量产出货,配套服务器从风冷双路到浸没式液冷(单组80,000+核心)都有了,但目前没有任何独立的SPEC跑分公开数据。2000分是Bernstein的估算,不是实测。CSP大规模采购需要POC验证周期,从送样到资质认证到批量上架通常两到三个季度。看看下半年是否有头部CSP的集采订单落地。