HBM vs DRAM: Por que os grandes modelos de IA não podem prescindir disso? Chips de armazenamento da "era plana" para a "revolução 3D"

Question

2026年6月30日，比特币在60,000美元附近窄幅震荡，以太坊维持在1,600美元区间。加密市场在经历6月以来的持续回调后，短期空头主导格局未改。但就在加密资产进入“垃圾时间”的同时，另一条赛道正经历前所未有的爆发式增长——半导体存储。

世界半导体贸易统计组织（WSTS）2026年春季报告大幅上调行业增长预期：2026年全球半导体市场规模或突破1.51万亿美元，同比增长90%，其中存储芯片同比增幅达250%，规模突破8,000亿美元。存储产值将首次超越晶圆代工，成为半导体第一增长极。

而这场存储革命的绝对主角，正是HBM（High Bandwidth Memory，高带宽内存）。2026年HBM市场规模预计增长58%至546亿美元，占DRAM市场近四成。HBM与DRAM究竟有什么区别？AI大模型为何对HBM如此依赖？

HBM与DRAM：同源不同命

HBM与DRAM共享同一种基础存储介质——动态随机存取存储器。但二者的技术路线、架构设计和应用场景，却走向了完全不同的方向。

传统DRAM走的是“平面扩张”路线。 以DDR4、DDR5为代表的传统DRAM采用平面架构，通过制程升级（如从20nm推进至2nm）和架构优化（如DDR5的预取位数提升）来提高性能。其核心逻辑是：在二维平面上不断缩小晶体管尺寸、提升频率。但这条路正逼近物理极限——2nm以下制程面临量子隧穿效应等难题，单靠制程微缩已无法满足AI算力对存储带宽的指数级需求。

HBM则选择了“垂直堆叠”的破局之路。 HBM采用3D结构，使用硅通孔（TSV）技术将数个DRAM裸片垂直堆叠，形成立方体结构——在DRAM芯片上开设数千个细微孔，通过垂直贯通的电极连接上下芯片；底层则是DRAM逻辑控制单元，负责整体时序与控制。这种“叠罗汉”式的设计，使得HBM能够在极小的物理空间内实现极高的带宽密度。

两者在关键性能指标上的差距堪称代际：

带宽方面，传统DRAM（如DDR5）带宽约为50 - 100 GB/s，而HBM3E单堆叠带宽可达1.2 TB/s，下一代HBM4预计将提升至2.0 TB/s以上。HBM的带宽是传统DRAM的10倍以上。

功耗效率方面，HBM可低至5 pJ/bit以下，传统DRAM则为10 - 15 pJ/bit。在动辄数千张GPU同时运转的数据中心，这一差距意味着每年数千万美元的电费差异。

延迟方面，传统DRAM凭借平面架构优势可维持在10 ns级，而HBM因堆叠层数增加，延迟在100 ns级。但AI训练推理场景对“吞吐量”的敏感度远高于“单次延迟”——海量参数的高速吞吐远比单次访问的快慢更重要。

成本方面，HBM的生产成本远高于传统DRAM。HBM4单Gb成本虽较HBM3下降30%，但仍是同容量DDR5的3 - 5倍。HBM消耗的晶圆用量约为DDR5的4至5倍，TSV工艺使得HBM芯片的比特密度显著低于同规格DDR——SK海力士D1z DDR4的比特密度为0.296 Gb/mm²，比其HBM3（0.16 Gb/mm²）高出85%。TSV所需的额外面积和复杂的堆叠封装工艺，是HBM成本高企的核心原因。

简言之：传统DRAM追求“便宜够用”，HBM追求“极致带宽”——这是一场“成本优先”与“带宽优先”的技术路线之争。

内存墙危机：为什么AI大模型非HBM不可？

AI大模型对HBM的依赖，根源在于一个被业界称为“内存墙”（Memory Wall）的根本性瓶颈。

过去20年间，GPU计算能力增长了6万倍，而DRAM带宽仅提升了100倍。算力提升速度远高于数据供给速度——就像一辆马力暴增的赛车，燃油管路却还是20年前的规格。GPU是引擎，HBM是燃油喷射系统；如果燃油供给速度跟不上，引擎马力再大也只能空转。

大语言模型的运行机制放大了这一矛盾。AI模型生成回答并非简单检索静态信息，而是持续维护一个包含上下文窗口、键值缓存（KV Cache）、中间激活和路由决策的“工作状态”。这些数据需以超低延迟实时访问且始终可用。在完整Token序列处理中，模型需持续访问并更新上下文——即便内存延迟轻微上升，也可能导致吞吐量下降、响应延迟，甚至迫使运营商增配硬件。

训练阶段，万亿参数的大模型需要在海量数据上反复迭代，每一次前向传播和反向传播都涉及巨量参数的读取与更新。HBM提供的TB/s级带宽，是缩短训练时间的决定性因素。

推理阶段，随着多模态大模型和AI Agent加速发展，Token调用量快速上升。推理应用的瓶颈往往不在于“算得有多快”，而在于“数据喂得有多快”。带宽的尽头就是HBM。

在系统层面，AI运行于分层内存架构之上：HBM为加速器提供数据，DRAM存储实时状态和对话记忆，基于NAND的SSD则为数据集、嵌入、检索索引、日志和检查点提供持久化存储。HBM处于最靠近计算核心的位置，承担着最高频、最紧急的数据供给任务——这是任何其他存储介质无法替代的。

正因如此，所有用于生成式AI训练和推理的领先AI加速器都使用HBM。HBM不是AI的“可选配件”，而是决定AI能走多快的“氧气瓶”。

供需失衡：一场持续数年的结构性短缺

HBM的需求是刚性的，供给却是“锁死的”。

需求端，2026年全球AI基础设施支出将达到4,500亿美元，其中推理算力占比首次超过70%，由此拉动GPU、HBM及高速网络芯片的强劲需求。2026年HBM需求增长主要由AI ASIC产能升级驱动，每颗AI芯片的HBM容量将从96 GB/192 GB大幅提升至216 GB/288 GB。英伟达Rubin平台虽单颗GPU的HBM容量与上代持平，但更高的出货量继续推高整体需求。全球九大云服务商2026年合计资本开支预计达约8,300亿美元，同比增长79%。

供给端，尽管三星、SK海力士、美光三大原厂已将70%的新增/可调配产能倾斜至HBM，但HBM产能缺口仍高达50%至60%。截至2026年首季，三大原厂的HBM产能已全部售罄。据SemiAnalysis数据，2026年DRAM供应低于需求约7%，HBM缺口6%、2027年扩大至9%。

更关键的是供给刚性。即便三大原厂现在决定扩产，受限于TSV工艺、先进封装良率、设备交付周期等物理约束，新增产能释放最快也要到2028 - 2029年。国际投行普遍认为HBM供不应求的结构性短缺至少将持续到2028年。英伟达CEO黄仁勋更明确表态：全球HBM供应短缺“根本不是短期市场波动，而会是一个持续数年的结构性行业困局”。

价格端，三星电子和SK海力士已将2026年HBM3E供应价格上调近20%。HBM4 12层初期合约价预计较2025年HBM3E 12层溢价10%以上。

市场格局：谁在主导这场存储革命？

HBM市场呈现极高的集中度。法人预测，SK海力士2026年出货市占率约52%，三星电子约39%，美光约8%，中国大陆业者维持极低比重。以销售额计算，SK海力士2026年HBM营收有望达59.5亿美元，稳居全球第一。

2026年首季全球HBM市场中，SK海力士市占率约51.4%。集邦科技预计其2026年全年HBM市占率可维持约50%；Counterpoint更预测其在HBM4市场的份额将达54%。

三大原厂的毛利率已突破70%甚至80%。HBM的利润分配呈“金字塔”结构——越靠近技术核心与瓶颈环节，分配比例越高。

与此同时，一个有趣的现象正在发生：通用型DRAM的盈利能力正在结构性反超HBM。截至2026年首季，通用型DRAM与HBM的营业利润率差距已扩大至逾15个百分点。市场测算显示，2026年将产能分配给通用DRAM，每片晶圆产生的营收已是HBM的两倍以上，毛利接近三倍。这正是SK海力士考虑将部分资源重新向通用DRAM倾斜的原因——但这恰恰印证了整个存储市场正处于全面性的景气高涨。

投资视角：HBM超级周期中的机会

HBM的结构性短缺与价格上行趋势，为投资者提供了清晰的产业逻辑支撑。

存储原厂是直接受益者。SK海力士（韩股）、三星电子（韩股）和美光（美股）凭借技术垄断和产能稀缺，赚取了产业链中的绝大部分超额利润。摩根士丹利基于DRAM均价至2026年上涨62%的预测，将存储原厂盈利预测上调56%至63%。

产业链上游同样受益。存储龙头的大规模扩产直接拉动刻蚀、薄膜沉积、测试等半导体设备需求，产业链景气度正从上游向中游传导。HBM的先进封装需求也推动了CoWoS等2.5D封装技术的产业化。

AI芯片厂商是HBM的最终需求方。英伟达（美股）、博通（美股）等AI芯片龙头对HBM的采购需求持续扩大。英伟达Rubin Ultra单颗GPU的HBM容量将提升至1 TB。

Gate股票交易：一站式参与全球存储与AI投资

对于希望参与这一轮存储超级周期的投资者，Gate股票提供了便捷的入市通道。

目前，Gate股票已形成覆盖美股、港股及韩股三大核心市场的7×24小时交易服务体系，支持超过10,000只美股及ETF、1,500余只港股及1,000余只韩股，合计覆盖全球超过12,500只股票及ETF资产。标的涵盖苹果、英伟达、微软、腾讯控股、小米集团、三星电子、SK海力士等全球代表性上市公司。

用户可通过Gate统一账户使用USDT一站式参与全球股票投资，支持最低0.01股起投的碎股交易，享有股息派发等权益。平台同时支持拆股、合股等公司行动服务，并已实现App与Web双端全面覆盖。

Gate股票在原有盘前、盘中及盘后交易基础上，进一步支持隔夜及周末交易，突破传统证券市场交易时间限制。券商间转仓服务也即将上线，将进一步提升用户股票资产管理的灵活性与便利性。

交易方式：用户在Gate平台完成统一账户充值后，即可在股票交易模块选择目标股票，以USDT计价进行买卖。平台提供实时行情、技术分析工具和订单类型选择（市价单、限价单等），操作流程与加密资产交易体验一致。

结语

HBM与DRAM的区别，本质上是“带宽优先”与“成本优先”两种技术路线的分野。在AI算力持续扩张的背景下，HBM凭借3D堆叠和TSV技术实现了对“内存墙”的突破，成为大模型训练与推理不可替代的核心组件。

2026年，全球半导体市场规模突破1.51万亿美元，存储芯片增长250%，HBM市场增长58%至546亿美元。产能缺口高达50%至60%，三大原厂产能全部售罄。这不是一轮普通的周期波动，而是由AI基础设施长期资本开支驱动的结构性变革。

对于投资者而言，存储原厂、设备材料、AI芯片三大链条均存在清晰的产业逻辑支撑。而Gate股票提供的7×24小时美港韩三股交易服务，为全球投资者参与这一轮存储超级周期提供了灵活高效的工具。在市场情绪极度恐惧（恐惧指数14 - 16）的当下，产业基本面与市场情绪之间的背离，往往孕育着最值得关注的结构性机会。

FAQ

Q1：HBM和DRAM的核心区别是什么？

HBM与传统DRAM的核心区别在于架构。传统DRAM采用平面架构，通过制程升级提升性能；HBM则采用3D堆叠技术，利用TSV硅通孔将多个DRAM裸片垂直堆叠，实现超宽数据路径。HBM3E带宽可达1.2 TB/s，是DDR5的10倍以上，但成本也是同容量DDR5的3 - 5倍。

Q2：为什么AI大模型必须使用HBM？

大模型训练和推理需要海量参数的高速读写。传统DRAM带宽增长远落后于算力提升（20年算力增6万倍，带宽仅增100倍），形成“内存墙”瓶颈。HBM凭借TB/s级带宽，能持续为GPU供给数据，避免算力空转。所有领先的AI加速器都使用HBM。

Q3：HBM市场的主要玩家有哪些？

HBM市场高度集中。SK海力士2026年出货市占率约52%，三星约39%，美光约8%。SK海力士以销售额计算稳居第一，2026年HBM营收有望达59.5亿美元。三大原厂2026年全部HBM产能已售罄，部分客户已将产能锁定至2028年。

Q4：HBM供不应求的状况会持续多久？

国际投行普遍认为HBM供不应求将至少持续到2028年。需求端受AI基础设施资本开支驱动，供给端受TSV工艺、封装良率、设备交付周期等物理约束。即便现在扩产，新增产能释放最快也要到2028 - 2029年。黄仁勋称这是“持续数年的结构性行业困局”。

Q5：如何在Gate平台投资HBM相关股票？

Gate股票支持美股、港股、韩股7×24小时交易，覆盖超12,500只股票及ETF。用户可通过统一账户使用USDT一站式投资，最低0.01股起投。HBM相关标的包括存储原厂SK海力士（韩股）、三星电子（韩股）、美光（美股），以及AI芯片厂商英伟达（美股）等。

BTC-1,00%

ETH0,46%

Ver original

HBM vs DRAM: Por que os grandes modelos de IA não podem prescindir disso? Chips de armazenamento da "era plana" para a "revolução 3D"

HBM与DRAM：同源不同命

内存墙危机：为什么AI大模型非HBM不可？

供需失衡：一场持续数年的结构性短缺

市场格局：谁在主导这场存储革命？

投资视角：HBM超级周期中的机会

Gate股票交易：一站式参与全球存储与AI投资

结语

FAQ

Tópicos em destaque

SKHynixTopsKOSPIByMarketCap

GateCompletesDividendDistribution

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

SolanaEcosystemANSEMSurges

Fixado