HBM vs DRAM:AI 大模型為何離不開它?存儲芯片從“平面時代”走向“3D 革命”

2026 年 6 月 30 日,比特幣在 60,000 美元附近窄幅震盪,以太坊維持在 1,600 美元區間。加密市場在經歷 6 月以來的持續回調後,短期空頭主導格局未改。但就在加密資產進入「垃圾時間」的同時,另一條賽道正經歷前所未有的爆發式增長——半導體存儲。

世界半導體貿易統計組織(WSTS)2026 年春季報告大幅上調行業增長預期:2026 年全球半導體市場規模或突破 1.51 萬億美元,同比增長 90%,其中存儲芯片同比增幅達 250%,規模突破 8,000 億美元。存儲產值將首次超越晶圓代工,成為半導體第一增長極。

而這場存儲革命的絕對主角,正是 HBM(High Bandwidth Memory,高帶寬內存)。2026 年 HBM 市場規模預計增長 58% 至 546 億美元,佔 DRAM 市場近四成。HBM 與 DRAM 究竟有什麼區別?AI 大模型為何對 HBM 如此依賴?

HBM 與 DRAM:同源不同命

HBM 與 DRAM 共享同一種基礎存儲介質——動態隨機存取存儲器。但二者的技術路線、架構設計和應用場景,卻走向了完全不同的方向。

傳統 DRAM 走的是「平面擴張」路線。 以 DDR4、DDR5 為代表的傳統 DRAM 採用平面架構,通過製程升級(如從 20nm 推進至 2nm)和架構優化(如 DDR5 的預取位數提升)來提高性能。其核心邏輯是:在二維平面上不斷縮小晶體管尺寸、提升頻率。但這條路正逼近物理極限——2nm 以下製程面臨量子隧穿效應等難題,單靠製程微縮已無法滿足 AI 算力對存儲帶寬的指數級需求。

HBM 則選擇了「垂直堆疊」的破局之路。 HBM 採用 3D 結構,使用硅通孔(TSV)技術將數個 DRAM 裸片垂直堆疊,形成立方體結構——在 DRAM 芯片上開設數千個細微孔,通過垂直貫通的電極連接上下芯片;底層則是 DRAM 邏輯控制單元,負責整體時序與控制。這種「疊羅漢」式的設計,使得 HBM 能夠在極小的物理空間內實現極高的帶寬密度。

兩者在關鍵性能指標上的差距堪稱代際:

帶寬方面,傳統 DRAM(如 DDR5)帶寬約為 50 - 100 GB/s,而 HBM3E 單堆疊帶寬可達 1.2 TB/s,下一代 HBM4 預計將提升至 2.0 TB/s 以上。HBM 的帶寬是傳統 DRAM 的 10 倍以上。

功耗效率方面,HBM 可低至 5 pJ/bit 以下,傳統 DRAM 則為 10 - 15 pJ/bit。在動輒數千張 GPU 同時運轉的數據中心,這一差距意味著每年數千萬美元的電費差異。

延遲方面,傳統 DRAM 憑藉平面架構優勢可維持在 10 ns 級,而 HBM 因堆疊層數增加,延遲在 100 ns 級。但 AI 訓練推理場景對「吞吐量」的敏感度遠高於「單次延遲」——海量參數的高速吞吐遠比單次訪問的快慢更重要。

成本方面,HBM 的生產成本遠高於傳統 DRAM。HBM4 單 Gb 成本雖較 HBM3 下降 30%,但仍是同容量 DDR5 的 3 - 5 倍。HBM 消耗的晶圓用量約為 DDR5 的 4 至 5 倍,TSV 工藝使得 HBM 芯片的比特密度顯著低於同規格 DDR——SK 海力士 D1z DDR4 的比特密度為 0.296 Gb/mm²,比其 HBM3(0.16 Gb/mm²)高出 85%。TSV 所需的額外面積和複雜的堆疊封裝工藝,是 HBM 成本高企的核心原因。

簡言之:傳統 DRAM 追求「便宜夠用」,HBM 追求「極致帶寬」——這是一場「成本優先」與「帶寬優先」的技術路線之爭

內存牆危機:為什麼 AI 大模型非 HBM 不可?

AI 大模型對 HBM 的依賴,根源在於一個被業界稱為「內存牆」(Memory Wall)的根本性瓶頸。

過去 20 年間,GPU 計算能力增長了 6 萬倍,而 DRAM 帶寬僅提升了 100 倍。算力提升速度遠高於數據供給速度——就像一輛馬力暴增的賽車,燃油管路卻還是 20 年前的規格。GPU 是引擎,HBM 是燃油噴射系統;如果燃油供給速度跟不上,引擎馬力再大也只能空轉。

大語言模型的運行機制放大了這一矛盾。AI 模型生成回答並非簡單檢索靜態信息,而是持續維護一個包含上下文窗口、鍵值緩存(KV Cache)、中間激活和路由決策的「工作狀態」。這些數據需以超低延遲實時訪問且始終可用。在完整 Token 序列處理中,模型需持續訪問並更新上下文——即便內存延遲輕微上升,也可能導致吞吐量下降、響應延遲,甚至迫使運營商增配硬件。

訓練階段,萬億參數的大模型需要在海量數據上反覆迭代,每一次前向傳播和反向傳播都涉及巨量參數的讀取與更新。HBM 提供的 TB/s 級帶寬,是縮短訓練時間的決定性因素。

推理階段,隨著多模態大模型和 AI Agent 加速發展,Token 調用量快速上升。推理應用的瓶頸往往不在於「算得有多快」,而在於「數據餵得有多快」。帶寬的盡頭就是 HBM。

在系統層面,AI 運行於分層內存架構之上:HBM 為加速器提供數據,DRAM 存儲實時狀態和對話記憶,基於 NAND 的 SSD 則為數據集、嵌入、檢索索引、日誌和檢查點提供持久化存儲。HBM 處於最靠近計算核心的位置,承擔著最高頻、最緊急的數據供給任務——這是任何其他存儲介質無法替代的。

正因如此,所有用於生成式 AI 訓練和推理的領先 AI 加速器都使用 HBM。HBM 不是 AI 的「可選配件」,而是決定 AI 能走多快的「氧氣瓶」。

供需失衡:一場持續數年的結構性短缺

HBM 的需求是剛性的,供給卻是「鎖死的」。

需求端,2026 年全球 AI 基礎設施支出將達到 4,500 億美元,其中推理算力佔比首次超過 70%,由此拉動 GPU、HBM 及高速網絡芯片的強勁需求。2026 年 HBM 需求增長主要由 AI ASIC 產能升級驅動,每顆 AI 芯片的 HBM 容量將從 96 GB/192 GB 大幅提升至 216 GB/288 GB。英偉達 Rubin 平台雖單顆 GPU 的 HBM 容量與上代持平,但更高的出貨量繼續推高整體需求。全球九大雲服務商 2026 年合計資本開支預計達約 8,300 億美元,同比增長 79%。

供給端,儘管三星、SK 海力士、美光三大原廠已將 70% 的新增/可調配產能傾斜至 HBM,但 HBM 產能缺口仍高達 50% 至 60%。截至 2026 年首季,三大原廠的 HBM 產能已全部售罄。據 SemiAnalysis 數據,2026 年 DRAM 供應低於需求約 7%,HBM 缺口 6%、2027 年擴大至 9%。

更關鍵的是供給剛性。即便三大原廠現在決定擴產,受限於 TSV 工藝、先進封裝良率、設備交付週期等物理約束,新增產能釋放最快也要到 2028 - 2029 年。國際投行普遍認為 HBM 供不應求的結構性短缺至少將持續到 2028 年。英偉達 CEO 黃仁勳更明確表態:全球 HBM 供應短缺「根本不是短期市場波動,而會是一個持續數年的結構性行業困局」。

價格端,三星電子和 SK 海力士已將 2026 年 HBM3E 供應價格上調近 20%。HBM4 12 層初期合約價預計較 2025 年 HBM3E 12 層溢價 10% 以上。

市場格局:誰在主導這場存儲革命?

HBM 市場呈現極高的集中度。法人預測,SK 海力士 2026 年出貨市佔率約 52%,三星電子約 39%,美光約 8%,中國大陸業者維持極低比重。以銷售額計算,SK 海力士 2026 年 HBM 營收有望達 59.5 億美元,穩居全球第一。

2026 年首季全球 HBM 市場中,SK 海力士市佔率約 51.4%。集邦科技預計其 2026 年全年 HBM 市佔率可維持約 50%;Counterpoint 更預測其在 HBM4 市場的份額將達 54%。

三大原廠的毛利率已突破 70% 甚至 80%。HBM 的利潤分配呈「金字塔」結構——越靠近技術核心與瓶頸環節,分配比例越高。

與此同時,一個有趣的現象正在發生:通用型 DRAM 的盈利能力正在結構性反超 HBM。截至 2026 年首季,通用型 DRAM 與 HBM 的營業利潤率差距已擴大至逾 15 個百分點。市場測算顯示,2026 年將產能分配給通用 DRAM,每片晶圓產生的營收已是 HBM 的兩倍以上,毛利接近三倍。這正是 SK 海力士考慮將部分資源重新向通用 DRAM 傾斜的原因——但這恰恰印證了整個存儲市場正處於全面性的景氣高漲。

投資視角:HBM 超級週期中的機會

HBM 的結構性短缺與價格上行趨勢,為投資者提供了清晰的產業邏輯支撐。

存儲原廠是直接受益者。SK 海力士(韓股)、三星電子(韓股)和美光(美股)憑藉技術壟斷和產能稀缺,賺取了產業鏈中的絕大部分超額利潤。摩根士丹利基於 DRAM 均價至 2026 年上漲 62% 的預測,將存儲原廠盈利預測上調 56% 至 63%。

產業鏈上游同樣受益。存儲龍頭的大規模擴產直接拉動刻蝕、薄膜沉積、測試等半導體設備需求,產業鏈景氣度正從上游向中游傳導。HBM 的先進封裝需求也推動了 CoWoS 等 2.5D 封裝技術的產業化。

AI 芯片廠商是 HBM 的最終需求方。英偉達(美股)、博通(美股)等 AI 芯片龍頭對 HBM 的採購需求持續擴大。英偉達 Rubin Ultra 單顆 GPU 的 HBM 容量將提升至 1 TB。

Gate 股票交易:一站式參與全球存儲與 AI 投資

對於希望參與這一輪存儲超級週期的投資者,Gate 股票提供了便捷的入市通道。

目前,Gate 股票已形成覆蓋美股、港股及韓股三大核心市場的 7×24 小時交易服務體系,支持超過 10,000 只美股及 ETF、1,500 余只港股及 1,000 余只韓股,合計覆蓋全球超過 12,500 只股票及 ETF 資產。標的涵蓋蘋果、英偉達、微軟、騰訊控股、小米集團、三星電子、SK 海力士等全球代表性上市公司。

用戶可通過 Gate 統一賬戶使用 USDT 一站式參與全球股票投資,支持最低 0.01 股起投的碎股交易,享有股息派發等權益。平台同時支持拆股、合股等公司行動服務,並已實現 App 與 Web 雙端全面覆蓋。

Gate 股票在原有盤前、盤中及盤後交易基礎上,進一步支持隔夜及週末交易,突破傳統證券市場交易時間限制。券商間轉倉服務也即將上線,將進一步提升用戶股票資產管理的靈活性與便利性。

交易方式:用戶在 Gate 平台完成統一賬戶充值後,即可在股票交易模塊選擇目標股票,以 USDT 計價進行買賣。平台提供實時行情、技術分析工具和訂單類型選擇(市價單、限價單等),操作流程與加密資產交易體驗一致。

結語

HBM 與 DRAM 的區別,本質上是「帶寬優先」與「成本優先」兩種技術路線的分野。在 AI 算力持續擴張的背景下,HBM 憑藉 3D 堆疊和 TSV 技術實現了對「內存牆」的突破,成為大模型訓練與推理不可替代的核心組件。

2026 年,全球半導體市場規模突破 1.51 萬億美元,存儲芯片增長 250%,HBM 市場增長 58% 至 546 億美元。產能缺口高達 50% 至 60%,三大原廠產能全部售罄。這不是一輪普通的週期波動,而是由 AI 基礎設施長期資本開支驅動的結構性變革。

對於投資者而言,存儲原廠、設備材料、AI 芯片三大鏈條均存在清晰的產業邏輯支撐。而 Gate 股票提供的 7×24 小時美港韓三股交易服務,為全球投資者參與這一輪存儲超級週期提供了靈活高效的工具。在市場情緒極度恐懼(恐懼指數 14 - 16)的當下,產業基本面與市場情緒之間的背離,往往孕育著最值得關注的結構性機會。

FAQ

Q1:HBM 和 DRAM 的核心區別是什麼?

HBM 與傳統 DRAM 的核心區別在於架構。傳統 DRAM 採用平面架構,通過製程升級提升性能;HBM 則採用 3D 堆疊技術,利用 TSV 硅通孔將多個 DRAM 裸片垂直堆疊,實現超寬數據路徑。HBM3E 帶寬可達 1.2 TB/s,是 DDR5 的 10 倍以上,但成本也是同容量 DDR5 的 3 - 5 倍。

Q2:為什麼 AI 大模型必須使用 HBM?

大模型訓練和推理需要海量參數的高速讀寫。傳統 DRAM 帶寬增長遠落後於算力提升(20 年算力增 6 萬倍,帶寬僅增 100 倍),形成「內存牆」瓶頸。HBM 憑藉 TB/s 級帶寬,能持續為 GPU 供給數據,避免算力空轉。所有領先的 AI 加速器都使用 HBM。

Q3:HBM 市場的主要玩家有哪些?

HBM 市場高度集中。SK 海力士 2026 年出貨市佔率約 52%,三星約 39%,美光約 8%。SK 海力士以銷售額計算穩居第一,2026 年 HBM 營收有望達 59.5 億美元。三大原廠 2026 年全部 HBM 產能已售罄,部分客戶已將產能鎖定至 2028 年。

Q4:HBM 供不應求的狀況會持續多久?

國際投行普遍認為 HBM 供不應求將至少持續到 2028 年。需求端受 AI 基礎設施資本開支驅動,供給端受 TSV 工藝、封裝良率、設備交付週期等物理約束。即便現在擴產,新增產能釋放最快也要到 2028 - 2029 年。黃仁勳稱這是「持續數年的結構性行業困局」。

Q5:如何在 Gate 平台投資 HBM 相關股票?

Gate 股票支持美股、港股、韓股 7×24 小時交易,覆蓋超 12,500 只股票及 ETF。用戶可通過統一賬戶使用 USDT 一站式投資,最低 0.01 股起投。HBM 相關標的包括存儲原廠 SK 海力士(韓股)、三星電子(韓股)、美光(美股),以及 AI 芯片廠商英偉達(美股)等。

BTC-1.13%
ETH0.52%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆