HBM vs DRAM：AI 大模型為何離不開它？存儲芯片從“平面時代”走向“3D 革命”

Question

2026 年 6 月 30 日，比特幣在 60,000 美元附近窄幅震盪，以太坊維持在 1,600 美元區間。加密市場在經歷 6 月以來的持續回調後，短期空頭主導格局未改。但就在加密資產進入「垃圾時間」的同時，另一條賽道正經歷前所未有的爆發式增長——半導體存儲。

世界半導體貿易統計組織（WSTS）2026 年春季報告大幅上調行業增長預期：2026 年全球半導體市場規模或突破 1.51 萬億美元，同比增長 90%，其中存儲芯片同比增幅達 250%，規模突破 8,000 億美元。存儲產值將首次超越晶圓代工，成為半導體第一增長極。

而這場存儲革命的絕對主角，正是 HBM（High Bandwidth Memory，高帶寬內存）。2026 年 HBM 市場規模預計增長 58% 至 546 億美元，佔 DRAM 市場近四成。HBM 與 DRAM 究竟有什麼區別？AI 大模型為何對 HBM 如此依賴？

HBM 與 DRAM：同源不同命

HBM 與 DRAM 共享同一種基礎存儲介質——動態隨機存取存儲器。但二者的技術路線、架構設計和應用場景，卻走向了完全不同的方向。

傳統 DRAM 走的是「平面擴張」路線。 以 DDR4、DDR5 為代表的傳統 DRAM 採用平面架構，通過製程升級（如從 20nm 推進至 2nm）和架構優化（如 DDR5 的預取位數提升）來提高性能。其核心邏輯是：在二維平面上不斷縮小晶體管尺寸、提升頻率。但這條路正逼近物理極限——2nm 以下製程面臨量子隧穿效應等難題，單靠製程微縮已無法滿足 AI 算力對存儲帶寬的指數級需求。

HBM 則選擇了「垂直堆疊」的破局之路。 HBM 採用 3D 結構，使用硅通孔（TSV）技術將數個 DRAM 裸片垂直堆疊，形成立方體結構——在 DRAM 芯片上開設數千個細微孔，通過垂直貫通的電極連接上下芯片；底層則是 DRAM 邏輯控制單元，負責整體時序與控制。這種「疊羅漢」式的設計，使得 HBM 能夠在極小的物理空間內實現極高的帶寬密度。

兩者在關鍵性能指標上的差距堪稱代際：

帶寬方面，傳統 DRAM（如 DDR5）帶寬約為 50 - 100 GB/s，而 HBM3E 單堆疊帶寬可達 1.2 TB/s，下一代 HBM4 預計將提升至 2.0 TB/s 以上。HBM 的帶寬是傳統 DRAM 的 10 倍以上。

功耗效率方面，HBM 可低至 5 pJ/bit 以下，傳統 DRAM 則為 10 - 15 pJ/bit。在動輒數千張 GPU 同時運轉的數據中心，這一差距意味著每年數千萬美元的電費差異。

延遲方面，傳統 DRAM 憑藉平面架構優勢可維持在 10 ns 級，而 HBM 因堆疊層數增加，延遲在 100 ns 級。但 AI 訓練推理場景對「吞吐量」的敏感度遠高於「單次延遲」——海量參數的高速吞吐遠比單次訪問的快慢更重要。

成本方面，HBM 的生產成本遠高於傳統 DRAM。HBM4 單 Gb 成本雖較 HBM3 下降 30%，但仍是同容量 DDR5 的 3 - 5 倍。HBM 消耗的晶圓用量約為 DDR5 的 4 至 5 倍，TSV 工藝使得 HBM 芯片的比特密度顯著低於同規格 DDR——SK 海力士 D1z DDR4 的比特密度為 0.296 Gb/mm²，比其 HBM3（0.16 Gb/mm²）高出 85%。TSV 所需的額外面積和複雜的堆疊封裝工藝，是 HBM 成本高企的核心原因。

簡言之：傳統 DRAM 追求「便宜夠用」，HBM 追求「極致帶寬」——這是一場「成本優先」與「帶寬優先」的技術路線之爭。

內存牆危機：為什麼 AI 大模型非 HBM 不可？

AI 大模型對 HBM 的依賴，根源在於一個被業界稱為「內存牆」（Memory Wall）的根本性瓶頸。

過去 20 年間，GPU 計算能力增長了 6 萬倍，而 DRAM 帶寬僅提升了 100 倍。算力提升速度遠高於數據供給速度——就像一輛馬力暴增的賽車，燃油管路卻還是 20 年前的規格。GPU 是引擎，HBM 是燃油噴射系統；如果燃油供給速度跟不上，引擎馬力再大也只能空轉。

大語言模型的運行機制放大了這一矛盾。AI 模型生成回答並非簡單檢索靜態信息，而是持續維護一個包含上下文窗口、鍵值緩存（KV Cache）、中間激活和路由決策的「工作狀態」。這些數據需以超低延遲實時訪問且始終可用。在完整 Token 序列處理中，模型需持續訪問並更新上下文——即便內存延遲輕微上升，也可能導致吞吐量下降、響應延遲，甚至迫使運營商增配硬件。

訓練階段，萬億參數的大模型需要在海量數據上反覆迭代，每一次前向傳播和反向傳播都涉及巨量參數的讀取與更新。HBM 提供的 TB/s 級帶寬，是縮短訓練時間的決定性因素。

推理階段，隨著多模態大模型和 AI Agent 加速發展，Token 調用量快速上升。推理應用的瓶頸往往不在於「算得有多快」，而在於「數據餵得有多快」。帶寬的盡頭就是 HBM。

在系統層面，AI 運行於分層內存架構之上：HBM 為加速器提供數據，DRAM 存儲實時狀態和對話記憶，基於 NAND 的 SSD 則為數據集、嵌入、檢索索引、日誌和檢查點提供持久化存儲。HBM 處於最靠近計算核心的位置，承擔著最高頻、最緊急的數據供給任務——這是任何其他存儲介質無法替代的。

正因如此，所有用於生成式 AI 訓練和推理的領先 AI 加速器都使用 HBM。HBM 不是 AI 的「可選配件」，而是決定 AI 能走多快的「氧氣瓶」。

供需失衡：一場持續數年的結構性短缺

HBM 的需求是剛性的，供給卻是「鎖死的」。

需求端，2026 年全球 AI 基礎設施支出將達到 4,500 億美元，其中推理算力佔比首次超過 70%，由此拉動 GPU、HBM 及高速網絡芯片的強勁需求。2026 年 HBM 需求增長主要由 AI ASIC 產能升級驅動，每顆 AI 芯片的 HBM 容量將從 96 GB/192 GB 大幅提升至 216 GB/288 GB。英偉達 Rubin 平台雖單顆 GPU 的 HBM 容量與上代持平，但更高的出貨量繼續推高整體需求。全球九大雲服務商 2026 年合計資本開支預計達約 8,300 億美元，同比增長 79%。

供給端，儘管三星、SK 海力士、美光三大原廠已將 70% 的新增/可調配產能傾斜至 HBM，但 HBM 產能缺口仍高達 50% 至 60%。截至 2026 年首季，三大原廠的 HBM 產能已全部售罄。據 SemiAnalysis 數據，2026 年 DRAM 供應低於需求約 7%，HBM 缺口 6%、2027 年擴大至 9%。

更關鍵的是供給剛性。即便三大原廠現在決定擴產，受限於 TSV 工藝、先進封裝良率、設備交付週期等物理約束，新增產能釋放最快也要到 2028 - 2029 年。國際投行普遍認為 HBM 供不應求的結構性短缺至少將持續到 2028 年。英偉達 CEO 黃仁勳更明確表態：全球 HBM 供應短缺「根本不是短期市場波動，而會是一個持續數年的結構性行業困局」。

價格端，三星電子和 SK 海力士已將 2026 年 HBM3E 供應價格上調近 20%。HBM4 12 層初期合約價預計較 2025 年 HBM3E 12 層溢價 10% 以上。

市場格局：誰在主導這場存儲革命？

HBM 市場呈現極高的集中度。法人預測，SK 海力士 2026 年出貨市佔率約 52%，三星電子約 39%，美光約 8%，中國大陸業者維持極低比重。以銷售額計算，SK 海力士 2026 年 HBM 營收有望達 59.5 億美元，穩居全球第一。

2026 年首季全球 HBM 市場中，SK 海力士市佔率約 51.4%。集邦科技預計其 2026 年全年 HBM 市佔率可維持約 50%；Counterpoint 更預測其在 HBM4 市場的份額將達 54%。

三大原廠的毛利率已突破 70% 甚至 80%。HBM 的利潤分配呈「金字塔」結構——越靠近技術核心與瓶頸環節，分配比例越高。

與此同時，一個有趣的現象正在發生：通用型 DRAM 的盈利能力正在結構性反超 HBM。截至 2026 年首季，通用型 DRAM 與 HBM 的營業利潤率差距已擴大至逾 15 個百分點。市場測算顯示，2026 年將產能分配給通用 DRAM，每片晶圓產生的營收已是 HBM 的兩倍以上，毛利接近三倍。這正是 SK 海力士考慮將部分資源重新向通用 DRAM 傾斜的原因——但這恰恰印證了整個存儲市場正處於全面性的景氣高漲。

投資視角：HBM 超級週期中的機會

HBM 的結構性短缺與價格上行趨勢，為投資者提供了清晰的產業邏輯支撐。

存儲原廠是直接受益者。SK 海力士（韓股）、三星電子（韓股）和美光（美股）憑藉技術壟斷和產能稀缺，賺取了產業鏈中的絕大部分超額利潤。摩根士丹利基於 DRAM 均價至 2026 年上漲 62% 的預測，將存儲原廠盈利預測上調 56% 至 63%。

產業鏈上游同樣受益。存儲龍頭的大規模擴產直接拉動刻蝕、薄膜沉積、測試等半導體設備需求，產業鏈景氣度正從上游向中游傳導。HBM 的先進封裝需求也推動了 CoWoS 等 2.5D 封裝技術的產業化。

AI 芯片廠商是 HBM 的最終需求方。英偉達（美股）、博通（美股）等 AI 芯片龍頭對 HBM 的採購需求持續擴大。英偉達 Rubin Ultra 單顆 GPU 的 HBM 容量將提升至 1 TB。

Gate 股票交易：一站式參與全球存儲與 AI 投資

對於希望參與這一輪存儲超級週期的投資者，Gate 股票提供了便捷的入市通道。

目前，Gate 股票已形成覆蓋美股、港股及韓股三大核心市場的 7×24 小時交易服務體系，支持超過 10,000 只美股及 ETF、1,500 余只港股及 1,000 余只韓股，合計覆蓋全球超過 12,500 只股票及 ETF 資產。標的涵蓋蘋果、英偉達、微軟、騰訊控股、小米集團、三星電子、SK 海力士等全球代表性上市公司。

用戶可通過 Gate 統一賬戶使用 USDT 一站式參與全球股票投資，支持最低 0.01 股起投的碎股交易，享有股息派發等權益。平台同時支持拆股、合股等公司行動服務，並已實現 App 與 Web 雙端全面覆蓋。

Gate 股票在原有盤前、盤中及盤後交易基礎上，進一步支持隔夜及週末交易，突破傳統證券市場交易時間限制。券商間轉倉服務也即將上線，將進一步提升用戶股票資產管理的靈活性與便利性。

交易方式：用戶在 Gate 平台完成統一賬戶充值後，即可在股票交易模塊選擇目標股票，以 USDT 計價進行買賣。平台提供實時行情、技術分析工具和訂單類型選擇（市價單、限價單等），操作流程與加密資產交易體驗一致。

結語

HBM 與 DRAM 的區別，本質上是「帶寬優先」與「成本優先」兩種技術路線的分野。在 AI 算力持續擴張的背景下，HBM 憑藉 3D 堆疊和 TSV 技術實現了對「內存牆」的突破，成為大模型訓練與推理不可替代的核心組件。

2026 年，全球半導體市場規模突破 1.51 萬億美元，存儲芯片增長 250%，HBM 市場增長 58% 至 546 億美元。產能缺口高達 50% 至 60%，三大原廠產能全部售罄。這不是一輪普通的週期波動，而是由 AI 基礎設施長期資本開支驅動的結構性變革。

對於投資者而言，存儲原廠、設備材料、AI 芯片三大鏈條均存在清晰的產業邏輯支撐。而 Gate 股票提供的 7×24 小時美港韓三股交易服務，為全球投資者參與這一輪存儲超級週期提供了靈活高效的工具。在市場情緒極度恐懼（恐懼指數 14 - 16）的當下，產業基本面與市場情緒之間的背離，往往孕育著最值得關注的結構性機會。

FAQ

Q1：HBM 和 DRAM 的核心區別是什麼？

HBM 與傳統 DRAM 的核心區別在於架構。傳統 DRAM 採用平面架構，通過製程升級提升性能；HBM 則採用 3D 堆疊技術，利用 TSV 硅通孔將多個 DRAM 裸片垂直堆疊，實現超寬數據路徑。HBM3E 帶寬可達 1.2 TB/s，是 DDR5 的 10 倍以上，但成本也是同容量 DDR5 的 3 - 5 倍。

Q2：為什麼 AI 大模型必須使用 HBM？

大模型訓練和推理需要海量參數的高速讀寫。傳統 DRAM 帶寬增長遠落後於算力提升（20 年算力增 6 萬倍，帶寬僅增 100 倍），形成「內存牆」瓶頸。HBM 憑藉 TB/s 級帶寬，能持續為 GPU 供給數據，避免算力空轉。所有領先的 AI 加速器都使用 HBM。

Q3：HBM 市場的主要玩家有哪些？

HBM 市場高度集中。SK 海力士 2026 年出貨市佔率約 52%，三星約 39%，美光約 8%。SK 海力士以銷售額計算穩居第一，2026 年 HBM 營收有望達 59.5 億美元。三大原廠 2026 年全部 HBM 產能已售罄，部分客戶已將產能鎖定至 2028 年。

Q4：HBM 供不應求的狀況會持續多久？

國際投行普遍認為 HBM 供不應求將至少持續到 2028 年。需求端受 AI 基礎設施資本開支驅動，供給端受 TSV 工藝、封裝良率、設備交付週期等物理約束。即便現在擴產，新增產能釋放最快也要到 2028 - 2029 年。黃仁勳稱這是「持續數年的結構性行業困局」。

Q5：如何在 Gate 平台投資 HBM 相關股票？

Gate 股票支持美股、港股、韓股 7×24 小時交易，覆蓋超 12,500 只股票及 ETF。用戶可通過統一賬戶使用 USDT 一站式投資，最低 0.01 股起投。HBM 相關標的包括存儲原廠 SK 海力士（韓股）、三星電子（韓股）、美光（美股），以及 AI 芯片廠商英偉達（美股）等。

BTC-1.13%

ETH0.52%

查看原文

HBM vs DRAM：AI 大模型為何離不開它？存儲芯片從“平面時代”走向“3D 革命”

HBM 與 DRAM：同源不同命

內存牆危機：為什麼 AI 大模型非 HBM 不可？

供需失衡：一場持續數年的結構性短缺

市場格局：誰在主導這場存儲革命？

投資視角：HBM 超級週期中的機會

Gate 股票交易：一站式參與全球存儲與 AI 投資

結語

FAQ

熱門話題

0成本拿2股SK海力士

預測世界盃法國VS瑞典

Solana生態ANSEM暴漲

Strategy擬回購股票漲超12%

USD1鏈上質押享年化7.66%

已置頂