廣場
最新
熱門
新聞
我的主頁
發布
农场跳跃者
2026-07-04 03:57:08
關注
Bernstein昨天給海光資訊的目標價從280元上調至450元,核心邏輯是Agentic AI正在顛覆過去四年「GPU獨佔AI capex」的格局,CPU的角色從配角回到主角。全球伺服器CPU TAM從2025年的390億美金膨脹到2030年的2230億美金,六倍。海光作為全球唯一Intel/AMD之外的x86伺服器CPU供應商,是這個結構性轉向裡最直接的中國受益標的。
先看Agentic AI為什麼對CPU需求完全不同於傳統LLM。LLM時代的工作負載映射在大規模並行矩陣運算上,GPU天然契合,CSP訓練集群的GPU:CPU比從2020年的3:1一路拉到2024年的8:1。但Agentic AI的計算結構完全不一樣。Agent編排、工具調用、上下文窗口管理、多Agent協調、人機交互迴路,這些全是通用順序處理,要求低時延和高記憶體頻寬,都是CPU的活。GPU的工作退縮到token生成本身,其餘一切回歸CPU。Bernstein給出的數據是GPU:CPU比到2030年反轉到2:1,CPU在推理集群AI capex中的佔比從14%升至50%。
AMD自己在2025年11月分析師日給的CPU TAM預期是600億美金,半年後2026年Q1財報電話會翻倍到1200億。Intel連此前減值報廢的庫存晶片都能賣掉,客戶搶著要。供需緊張程度可見一斑。
中國的x86伺服器CPU TAM從2025年的70億美金到2030年的270億美金,但增長節奏分兩個階段。2025到2028年CAGR約31%,低於全球的35%,原因是雙重供給約束。一方面AMD和Intel的產能被美國超大規模客戶優先吸收,分配給中國的份額在縮減。另一方面SMIC先進製程產能有限,既限制了國產AI加速卡的放量(AI加速卡供應不足直接壓制CPU的配套需求),也限制了海光自身的晶圓分配。2028年之後這兩個約束同時鬆動。SMIC及其他國內代工廠的先進節點產能規模化釋放,國產AI晶片供應上量帶動伺服器整體部署加速,疊加地方政府主導的AIDC投資追趕,中國CPU市場CAGR升至36%,開始跑贏全球。
海光的技術代際演進值得細看。2016年通過AMD Zen1授權起步,2019年被列入實體清單後失去AMD後續技術支援,但Zen1的IP授權本身不可被追溯撤銷。從Gen2到G4,海光在14nm(後轉SMIC N+1/10nm等效)的製程約束下,透過架構、記憶體子系統和I/O的自主改進,每代實現30-50%的性能提升。G4已經做到64核、DDR5、PCIe5.0,SPEC2017 int-rate得分大約1000,對標Intel Xeon四代/五代(2022-2023年產品)和AMD Zen3(2021年產品),技術差距穩定在2-3年。一個有意思的側面驗證是今年曝出的StackWarp硬體漏洞影響了多代AMD Zen處理器,海光完全不受影響,原因是其安全架構已經從AMD的SEV-SNP替換為自研的CSV3。這說明微架構層面的分叉是真實的,不是換皮。
G5是整個增長邏輯的承重點。128核、512執行緒(SMT4)、16通道DDR5、CXL2.0,全自研微架構,預計在SMIC N+2(7nm等效)上製造。Bernstein估計SPEC2017 int-rate得分能到2000以上,而Intel Granite Rapids(128 P核,2024年9月上市)得分2440,AMD Zen5(2024年)得分2089。如果G5按計劃出來,海光跟全球最新產品的差距就從現在的「差兩代」縮小到「差一代」。
128核的可行性不依賴製程突破,依賴chiplet封裝。不上單片128核的巨型die(良率會崩),而是把多個較小的compute chiplet拼在一起,這是AMD EPYC從Zen2開始用的路線。在SMIC 7nm等效節點上做較小面積的計算die,良率可控,總核心數取決於封裝多少塊die。IPC的+17%提升來自從Gen2到G4積累的四代全流程設計經驗加上國產EDA工具在7nm數字邏輯綜合上的成熟。16通道DDR5則依賴長鑫存儲的DDR5產能擴張和瀾起科技的CXL控制器IP。三個條件中,SMIC的7nm產能分配是最硬的瓶頸。
海光G5真正差異化的點在SMT4。512執行緒/每socket,這在當前所有伺服器CPU裡是最高水平。AMD和Intel的主流產品是SMT2。SMT4在什麼場景有優勢?多租戶推理服務(邏輯CPU密度翻倍,單位推理請求成本下降)、Agentic AI的編排層(大量I/O-bound和memory-bound的輕量執行緒)、以及記憶體受限的LLM推理(執行緒在等KV-cache數據時其他執行緒能利用執行單元)。這恰好是中國市場未來最大的增量場景。中國在推理側有結構性優勢,電力成本低加上DeepSeek等廠商展示的LLM推理優化能力,意味著同樣算力下token產出更高。如果中國數據中心的CPU:GPU配比因此高於美國,那CPU需求的上行空間比Bernstein的base case還要大。
Bernstein給海光的市佔率預測是按價值從2025年的19%到2030年的36%,按出貨量接近50%(因ASP低於Intel/AMD)。邏輯分兩步。第一步是信創存量需求的持續消化,這是政策驅動的底倉,不依賴性能絕對值。第二步是2027年之後CSP的商業化採購啟動,這才是增量的大頭。CSP客群到2030年會佔中國x86伺服器部署的約75%。海光在這個市場從目前的中個位數滲透率做到20%,需要G5的性能足夠用,同時AMD/Intel的供應持續偏緊。海光還有一個獨特槓桿,CPU+DCU(AI加速卡)的全棧捆綁。在國產AI晶片供應緊張期,海光可以用DCU的分配權換CPU的採購量,反之亦然。除華為外沒有第二家能這麼做。
整套邏輯成立與否,供給側取決於SMIC先進節點的產能爬坡能不能支撐G5持續放量,需求側取決於CSP客戶的實測驗收。G5在6月已確認量產出貨,配套伺服器從風冷雙路到浸沒式液冷(單組80,000+核心)都有了,但目前沒有任何獨立的SPEC跑分公開數據。2000分是Bernstein的估算,不是實測。CSP大規模採購需要POC驗證週期,從送樣到資質認證到批量上架通常兩到三個季度。看看下半年是否有頭部CSP的採購訂單落地。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見
聲明
。
打賞
按讚
回覆
轉發
分享
回覆
請輸入回覆內容
請輸入回覆內容
回覆
暫無回覆
熱門話題
查看更多
#
gStocks代幣化股票上線
475.79萬 熱度
#
非農爆冷打壓加息預期
104.58萬 熱度
#
預測世界盃巴西VS挪威
19.93萬 熱度
#
ETH突破1700
1.52億 熱度
#
Meta賣算力引發存儲股大跌
139.55萬 熱度
已置頂
網站地圖
Bernstein昨天給海光資訊的目標價從280元上調至450元,核心邏輯是Agentic AI正在顛覆過去四年「GPU獨佔AI capex」的格局,CPU的角色從配角回到主角。全球伺服器CPU TAM從2025年的390億美金膨脹到2030年的2230億美金,六倍。海光作為全球唯一Intel/AMD之外的x86伺服器CPU供應商,是這個結構性轉向裡最直接的中國受益標的。
先看Agentic AI為什麼對CPU需求完全不同於傳統LLM。LLM時代的工作負載映射在大規模並行矩陣運算上,GPU天然契合,CSP訓練集群的GPU:CPU比從2020年的3:1一路拉到2024年的8:1。但Agentic AI的計算結構完全不一樣。Agent編排、工具調用、上下文窗口管理、多Agent協調、人機交互迴路,這些全是通用順序處理,要求低時延和高記憶體頻寬,都是CPU的活。GPU的工作退縮到token生成本身,其餘一切回歸CPU。Bernstein給出的數據是GPU:CPU比到2030年反轉到2:1,CPU在推理集群AI capex中的佔比從14%升至50%。
AMD自己在2025年11月分析師日給的CPU TAM預期是600億美金,半年後2026年Q1財報電話會翻倍到1200億。Intel連此前減值報廢的庫存晶片都能賣掉,客戶搶著要。供需緊張程度可見一斑。
中國的x86伺服器CPU TAM從2025年的70億美金到2030年的270億美金,但增長節奏分兩個階段。2025到2028年CAGR約31%,低於全球的35%,原因是雙重供給約束。一方面AMD和Intel的產能被美國超大規模客戶優先吸收,分配給中國的份額在縮減。另一方面SMIC先進製程產能有限,既限制了國產AI加速卡的放量(AI加速卡供應不足直接壓制CPU的配套需求),也限制了海光自身的晶圓分配。2028年之後這兩個約束同時鬆動。SMIC及其他國內代工廠的先進節點產能規模化釋放,國產AI晶片供應上量帶動伺服器整體部署加速,疊加地方政府主導的AIDC投資追趕,中國CPU市場CAGR升至36%,開始跑贏全球。
海光的技術代際演進值得細看。2016年通過AMD Zen1授權起步,2019年被列入實體清單後失去AMD後續技術支援,但Zen1的IP授權本身不可被追溯撤銷。從Gen2到G4,海光在14nm(後轉SMIC N+1/10nm等效)的製程約束下,透過架構、記憶體子系統和I/O的自主改進,每代實現30-50%的性能提升。G4已經做到64核、DDR5、PCIe5.0,SPEC2017 int-rate得分大約1000,對標Intel Xeon四代/五代(2022-2023年產品)和AMD Zen3(2021年產品),技術差距穩定在2-3年。一個有意思的側面驗證是今年曝出的StackWarp硬體漏洞影響了多代AMD Zen處理器,海光完全不受影響,原因是其安全架構已經從AMD的SEV-SNP替換為自研的CSV3。這說明微架構層面的分叉是真實的,不是換皮。
G5是整個增長邏輯的承重點。128核、512執行緒(SMT4)、16通道DDR5、CXL2.0,全自研微架構,預計在SMIC N+2(7nm等效)上製造。Bernstein估計SPEC2017 int-rate得分能到2000以上,而Intel Granite Rapids(128 P核,2024年9月上市)得分2440,AMD Zen5(2024年)得分2089。如果G5按計劃出來,海光跟全球最新產品的差距就從現在的「差兩代」縮小到「差一代」。
128核的可行性不依賴製程突破,依賴chiplet封裝。不上單片128核的巨型die(良率會崩),而是把多個較小的compute chiplet拼在一起,這是AMD EPYC從Zen2開始用的路線。在SMIC 7nm等效節點上做較小面積的計算die,良率可控,總核心數取決於封裝多少塊die。IPC的+17%提升來自從Gen2到G4積累的四代全流程設計經驗加上國產EDA工具在7nm數字邏輯綜合上的成熟。16通道DDR5則依賴長鑫存儲的DDR5產能擴張和瀾起科技的CXL控制器IP。三個條件中,SMIC的7nm產能分配是最硬的瓶頸。
海光G5真正差異化的點在SMT4。512執行緒/每socket,這在當前所有伺服器CPU裡是最高水平。AMD和Intel的主流產品是SMT2。SMT4在什麼場景有優勢?多租戶推理服務(邏輯CPU密度翻倍,單位推理請求成本下降)、Agentic AI的編排層(大量I/O-bound和memory-bound的輕量執行緒)、以及記憶體受限的LLM推理(執行緒在等KV-cache數據時其他執行緒能利用執行單元)。這恰好是中國市場未來最大的增量場景。中國在推理側有結構性優勢,電力成本低加上DeepSeek等廠商展示的LLM推理優化能力,意味著同樣算力下token產出更高。如果中國數據中心的CPU:GPU配比因此高於美國,那CPU需求的上行空間比Bernstein的base case還要大。
Bernstein給海光的市佔率預測是按價值從2025年的19%到2030年的36%,按出貨量接近50%(因ASP低於Intel/AMD)。邏輯分兩步。第一步是信創存量需求的持續消化,這是政策驅動的底倉,不依賴性能絕對值。第二步是2027年之後CSP的商業化採購啟動,這才是增量的大頭。CSP客群到2030年會佔中國x86伺服器部署的約75%。海光在這個市場從目前的中個位數滲透率做到20%,需要G5的性能足夠用,同時AMD/Intel的供應持續偏緊。海光還有一個獨特槓桿,CPU+DCU(AI加速卡)的全棧捆綁。在國產AI晶片供應緊張期,海光可以用DCU的分配權換CPU的採購量,反之亦然。除華為外沒有第二家能這麼做。
整套邏輯成立與否,供給側取決於SMIC先進節點的產能爬坡能不能支撐G5持續放量,需求側取決於CSP客戶的實測驗收。G5在6月已確認量產出貨,配套伺服器從風冷雙路到浸沒式液冷(單組80,000+核心)都有了,但目前沒有任何獨立的SPEC跑分公開數據。2000分是Bernstein的估算,不是實測。CSP大規模採購需要POC驗證週期,從送樣到資質認證到批量上架通常兩到三個季度。看看下半年是否有頭部CSP的採購訂單落地。