SemiAnalysis:從基礎設施到模型層,AI價值鏈上的財富遷移正在提速

AI產業的價值重心正在發生結構性轉移。

過去兩年間,輝達、記憶體廠商及能源供應商主導了AI投資回報的分配,但隨著智能體AI(Agentic AI)商業化加速,模型層的利潤空間正以前所未有的速度擴張,而掌控算力供應端的輝達與台積電,卻尚未將這一趨勢充分反映於定價之中。

Anthropic是這一轉變的最直接註腳。據SemiAnalysis最新研究,Anthropic的年化營收(ARR)已從年初的90億美元飆升至440億美元以上,其推理基礎設施的毛利率同期從38%躍升至逾70%。與此同時,代幣(token)生產成本因硬體疊代和軟體優化大幅壓縮,價值與成本之間的剪刀差持續擴大,推動模型廠商進入利潤率快速抬升的新階段。

在供應端,輝達和台積電坐擁最稀缺的資源,卻尚未對當前的需求盛況作出充分的價格響應。SemiAnalysis認為,這一定價滯後構成了一個重要的市場錯位:以Vera Rubin(VR NVL72)為代表的下一代系統具備顯著的價格上調空間,而誰能在這場價值重新分配中搶佔先機,將深刻影響AI產業鏈各環節的投資邏輯。

AI價值池的三年遷移路徑

2023年至2025年間,AI投資的超額回報主要集中在基礎設施層。

輝達於2023年5月首次發布爆款財報,單日盤後大漲25%,正式開啟AI投資浪潮。2024年,Vistra和GE Vernova分別上漲265%和146%,躋身標普500表現最強個股,能源瓶頸成為市場焦點。2025年,記憶體板塊接棒領漲,SanDisk、Western Digital、Seagate和Micron等均錄得全年逾200%的漲幅,存儲供需失衡成為驅動定價的核心變量。

與此同時,模型廠商和推理服務商的毛利率長期承壓。彼時AI的實際效用被批評者認為不過是「更好的谷歌搜索」加上聊天界面,與數萬億美元的預期資本開支嚴重背離。

這一格局在2025年底出現了根本性的轉變。

智能體AI:重塑代幣經濟學的拐點

SemiAnalysis將2025年12月視為AI商業化的真正拐點——智能體AI開始穩定運行,並在企業工作流中大規模落地。這一變化的核心意義,在於它從根本上改變了代幣的經濟價值。

以SemiAnalysis自身為例,**其年化代幣支出已相當於員工薪酬總額的約30%,每名員工每月消耗代幣量超過50億個,是Meta內部人均水平的5倍以上。**研究團隊列舉了多個真實案例:原本需要初級分析師數小時完成的財務建模、圖表製作和盈利分析等工作,現在通過智能體以極低的代幣成本即可完成,而同等人力成本曾高達數百至數千美元。

與此同時,代幣的生產成本正在急劇下降。SemiAnalysis估算,在智能體任務場景下,運行Opus 4.7的實際混合價格約為每百萬代幣0.99美元,遠低於5美元/25美元的官方標價——原因在於智能體工作負載具有極高的輸入輸出比(約300:1)和超過90%的快取命中率,大量代幣落入最低價格檔位。

硬體層面的加速同樣顯著。相較於一年前的H100,Blackwell系列在前沿工作負載下每秒可生成的代幣數量提升約30倍。進一步對比顯示,最優化配置下的GB300 NVL72相較最優化H100在FP8精度下吞吐量提升約17倍,切換至FP4後這一差距擴大至32倍,而總擁有成本(TCO)僅高出約70%。

價值與成本的雙向剪刀差,正是Anthropic毛利率從38%躍升至70%以上的核心驅動力。

模型層定價權:為何不會被競爭蠶食

面對模型廠商利潤率的快速擴張,市場最常見的質疑是:競爭最終會壓低價格。SemiAnalysis對此持保留意見,並給出兩點支撐。

**其一,前沿閉源模型的定價權依然穩固。**儘管開源模型的基準測試成績不斷刷新,但在真實的知識工作場景中,其表現仍明顯弱於閉源前沿模型。以Kimi K2.6(定價0.95美元/4美元)為例,其對Anthropic Opus定價的下行壓力十分有限。

**其二,算力約束意味著沒有任何一家前沿實驗室能夠獨自滿足整個市場的需求。**Anthropic已開始透過將Claude Code鎖定在每月100美元以上訂閱門檻背後、限制第三方接入等方式主動管理需求,代幣需求在可預見的未來將持續超過供給。這一結構性稀缺賦予了前沿模型廠商按價值而非成本定價的底氣。

Anthropic已通過產品線策略兌現這一邏輯:Opus fast定價是普通Opus的6倍,即將推出的Mythos定價為25美元/125美元,是普通Opus的5倍,而頭部企業客戶仍願意為這些高價SKU買單。SemiAnalysis表示,若Anthropic將Mythos fast定價至150美元/750美元,其本身也會是付費用戶。

輝達與台積電:稀缺資源的定價滯後

然而,掌握最核心稀缺資源的兩家公司——輝達與台積電——卻並未充分跟上這一波價值重估。

台積電的N3先進製程產能已成為整個AI算力擴張最緊張的瓶頸。輝達、博通、Annapurna、聯發科和AMD均在爭奪有限的N3晶圓配額,而N3產能利用率預計將在2026年下半年突破100%。DRAM晶圓廠利用率已超過90%,記憶體整體供應偏緊,但定價卻相對保守。

SemiAnalysis認為,台積電完全有條件大幅提價,且客戶不僅會接受,部分客戶甚至會歡迎——輝達就是典型案例:若TSMC提價意味著競爭對手獲得更少產能配額,輝達支付更高晶圓價格反而有利於鞏固其市場地位。輝達CEO黃仁勳2024年曾公開表示台積電應該提高晶圓價格,其背後邏輯正在於此。

輝達自身的定價策略也呈現出類似的保守傾向。SemiAnalysis指出,輝達的定價框架仍錨定於此前「單位算力願付價格隨時間下降」的假設,但這一假設已不再成立。隨著智能體工作負載爆發,算力需求不再是線性增長,而是呈現複合加速態勢。

Rubin系統:量化Nvidia的定價空間

以即將於2026年下半年發布的Vera Rubin(VR NVL72)為參照,SemiAnalysis構建了一套「一圖定乾坤」(One Chart to Rule Them All)的定價分析框架,從成本端與價值端分別錨定租金定價的地板與天花板。

成本端(地板):基於Neocloud(新興雲服務商)項目內部收益率(IRR)不低於15.6%的部署門檻,VR NVL72每小時每GPU的最低租金需達約4.92美元,方可維持Neocloud的部署意願。

價值端(天花板):以GB300當前5年期合約租金約每PFLOP 0.70美元為錨點,VR NVL72對應的租金上限約為每GPU每小時12.25美元。

目前,VR NVL72系統定價僅使每PFLOP成本降至約0.28美元,相比GB300 NVL72降幅達60%,遠超歷史趨勢線的改善幅度。這意味著Nvidia的伺服器價格存在約40%的上調空間,即便調價後仍可為Neocloud留下足夠利潤空間,且整體成本改善幅度依然低於歷史趨勢。

SOCAMM記憶體定價是另一個關鍵變量。VR NVL72採用插槽式LPDDR5X記憶體模組(SOCAMM),可與計算單元獨立定價。SemiAnalysis估算,輝達在2026年一季度支付的SOCAMM合約價約為每GB 8美元,較上季度有顯著跳升;預計至2026年底,SOCAMM價格可能超過每GB 13美元。在此背景下,輝達若在SOCAMM上實現60%的毛利率,邏輯上具備合理性:一方面記憶體供應受限、輝達掌握最大份額優勢;另一方面,VR NVL72在TCO層面的性能領先地位使客戶缺乏替代選擇。

價值歸宿:誰在贏,誰在等

SemiAnalysis的框架揭示出當前AI價值分配的核心矛盾:代幣經濟學的改善正在迅速推高模型廠商、推理服務商及Neocloud的利潤,但作為算力供給端最稀缺資源的掌控者,輝達和台積電的定價行為與其供給稀缺性之間存在明顯錯位。

這一錯位的持續,本質上是一種主動選擇——輝達正在扮演類似「AI中央銀行」的角色,通過軟體效率提升向下游輸送價值,以維持生態系統的長期擴張動力,同時規避反壟斷監管壓力。台積電則延續了歷史上「穩定生態、不吃盡上行紅利」的定價哲學。

然而隨著推理ROI日益清晰、價值定價邏輯在市場中普及,這兩家公司向價值定價框架切換的壓力將持續上升。一旦切換發生,AI產業鏈的價值分配格局將再度重塑——屆時,算力供給端的議價權將在更大程度上向硬體層回歸。

風險提示及免責條款

        市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。
TOKEN-2.89%
VR-0.48%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆