先看Agentic AI為什麼對CPU需求完全不同於傳統LLM。LLM時代的工作負載映射在大規模並行矩陣運算上，GPU天然契合，CSP訓練集群的GPU:CPU比從2020年的3:1一路拉到2024年的8:1。但Agentic AI的計算結構完全不一樣。Agent編排、工具調用、上下文窗口管理、多Agent協調、人機交互迴路，這些全是通用順序處理，要求低時延和高記憶體頻寬，都是CPU的活。GPU的工作退縮到token生成本身，其餘一切回歸CPU。Bernstein給出的數據是GPU:CPU比到2030年反轉到2:1，CPU在推理集群AI capex中的佔比從14%升至50%。
AMD自己在2025年11月分析師日給的CPU TAM預期是600億美金，半年後2026年Q1財報電話會翻倍到1200億。Intel連此前減值報廢的庫存晶片都能賣掉，客戶搶著要。供需緊張程度可見一斑。
中國的x86伺服器CPU TAM從2025年的70億美金到2030年的270億美金，但增長節奏分兩個階段。2025到2028年CAGR約31%，低於全球的35%，原因是雙重供給約束。一方面AMD和Intel的產能被美國超大規模客戶優先吸收，分配給中國的份額在縮減。另一方面SMIC先進製程產能有限，既限制了國產AI加速卡的放量（AI加速卡供應不足直接壓制CPU的配套需求），也限制了海光自身的晶圓分配。2028年之後這兩個約束同時鬆動。SMIC及其他國內代工廠的先進節點產能規模化釋放，國產AI晶片供應上量帶動伺服器整體部署加速，疊加地方政府主導的AIDC投資追趕，中國CPU市場CAGR升至36%，開始跑贏全球。
海光的技術代際演進值得細看。2016年通過AMD Zen1授權起步，2019年被列入實體清單後失去AMD後續技術支援，但Zen1的IP授權本身不可被追溯撤銷。從Gen2到G4，海光在14nm（後轉SMIC N+1/10nm等效）的製程約束下，透過架構、記憶體子系統和I/O的自主改進，每代實現30-50%的性能提升。G4已經做到64核、DDR5、PCIe5.0，SPEC2017 int-rate得分大約1000，對標Intel Xeon四代/五代（2022-2023年產品）和AMD Zen3（2021年產品），技術差距穩定在2-3年。一個有意思的側面驗證是今年曝出的StackWarp硬體漏洞影響了多代AMD Zen處理器，海光完全不受影響，原因是其安全架構已經從AMD的SEV-SNP替換為自研的CSV3。這說明微架構層面的分叉是真實的，不是換皮。
G5是整個增長邏輯的承重點。128核、512執行緒（SMT4）、16通道DDR5、CXL2.0，全自研微架構，預計在SMIC N+2（7nm等效）上製造。Bernstein估計SPEC2017 int-rate得分能到2000以上，而Intel Granite Rapids（128 P核，2024年9月上市）得分2440，AMD Zen5（2024年）得分2089。如果G5按計劃出來，海光跟全球最新產品的差距就從現在的「差兩代」縮小到「差一代」。
128核的可行性不依賴製程突破，依賴chiplet封裝。不上單片128核的巨型die（良率會崩），而是把多個較小的compute chiplet拼在一起，這是AMD EPYC從Zen2開始用的路線。在SMIC 7nm等效節點上做較小面積的計算die，良率可控，總核心數取決於封裝多少塊die。IPC的+17%提升來自從Gen2到G4積累的四代全流程設計經驗加上國產EDA工具在7nm數字邏輯綜合上的成熟。16通道DDR5則依賴長鑫存儲的DDR5產能擴張和瀾起科技的CXL控制器IP。三個條件中，SMIC的7nm產能分配是最硬的瓶頸。
海光G5真正差異化的點在SMT4。512執行緒/每socket，這在當前所有伺服器CPU裡是最高水平。AMD和Intel的主流產品是SMT2。SMT4在什麼場景有優勢？多租戶推理服務（邏輯CPU密度翻倍，單位推理請求成本下降）、Agentic AI的編排層（大量I/O-bound和memory-bound的輕量執行緒）、以及記憶體受限的LLM推理（執行緒在等KV-cache數據時其他執行緒能利用執行單元）。這恰好是中國市場未來最大的增量場景。中國在推理側有結構性優勢，電力成本低加上DeepSeek等廠商展示的LLM推理優化能力，意味著同樣算力下token產出更高。如果中國數據中心的CPU:GPU配比因此高於美國，那CPU需求的上行空間比Bernstein的base case還要大。
Bernstein給海光的市佔率預測是按價值從2025年的19%到2030年的36%，按出貨量接近50%（因ASP低於Intel/AMD）。邏輯分兩步。第一步是信創存量需求的持續消化，這是政策驅動的底倉，不依賴性能絕對值。第二步是2027年之後CSP的商業化採購啟動，這才是增量的大頭。CSP客群到2030年會佔中國x86伺服器部署的約75%。海光在這個市場從目前的中個位數滲透率做到20%，需要G5的性能足夠用，同時AMD/Intel的供應持續偏緊。海光還有一個獨特槓桿，CPU+DCU（AI加速卡）的全棧捆綁。在國產AI晶片供應緊張期，海光可以用DCU的分配權換CPU的採購量，反之亦然。除華為外沒有第二家能這麼做。
整套邏輯成立與否，供給側取決於SMIC先進節點的產能爬坡能不能支撐G5持續放量，需求側取決於CSP客戶的實測驗收。G5在6月已確認量產出貨，配套伺服器從風冷雙路到浸沒式液冷（單組80,000+核心）都有了，但目前沒有任何獨立的SPEC跑分公開數據。2000分是Bernstein的估算，不是實測。CSP大規模採購需要POC驗證週期，從送樣到資質認證到批量上架通常兩到三個季度。看看下半年是否有頭部CSP的採購訂單落地。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

打賞
按讚
回覆
轉發
分享

回覆

請輸入回覆內容

暫無回覆

熱門話題
查看更多
#
gStocks代幣化股票上線
475.79萬熱度
#
非農爆冷打壓加息預期
104.58萬熱度
#
預測世界盃巴西VS挪威
19.93萬熱度
#
ETH突破1700
1.52億熱度
#
Meta賣算力引發存儲股大跌
139.55萬熱度

已置頂

熱門話題

gStocks代幣化股票上線

非農爆冷打壓加息預期

預測世界盃巴西VS挪威

ETH突破1700

Meta賣算力引發存儲股大跌

已置頂