HBM vs DRAM: Por que os grandes modelos de IA não podem prescindir disso? Chips de armazenamento da "era plana" para a "revolução 3D"

2026年6月30日,比特币在60,000美元附近窄幅震荡,以太坊维持在1,600美元区间。加密市场在经历6月以来的持续回调后,短期空头主导格局未改。但就在加密资产进入“垃圾时间”的同时,另一条赛道正经历前所未有的爆发式增长——半导体存储。

世界半导体贸易统计组织(WSTS)2026年春季报告大幅上调行业增长预期:2026年全球半导体市场规模或突破1.51万亿美元,同比增长90%,其中存储芯片同比增幅达250%,规模突破8,000亿美元。存储产值将首次超越晶圆代工,成为半导体第一增长极。

而这场存储革命的绝对主角,正是HBM(High Bandwidth Memory,高带宽内存)。2026年HBM市场规模预计增长58%至546亿美元,占DRAM市场近四成。HBM与DRAM究竟有什么区别?AI大模型为何对HBM如此依赖?

HBM与DRAM:同源不同命

HBM与DRAM共享同一种基础存储介质——动态随机存取存储器。但二者的技术路线、架构设计和应用场景,却走向了完全不同的方向。

传统DRAM走的是“平面扩张”路线。 以DDR4、DDR5为代表的传统DRAM采用平面架构,通过制程升级(如从20nm推进至2nm)和架构优化(如DDR5的预取位数提升)来提高性能。其核心逻辑是:在二维平面上不断缩小晶体管尺寸、提升频率。但这条路正逼近物理极限——2nm以下制程面临量子隧穿效应等难题,单靠制程微缩已无法满足AI算力对存储带宽的指数级需求。

HBM则选择了“垂直堆叠”的破局之路。 HBM采用3D结构,使用硅通孔(TSV)技术将数个DRAM裸片垂直堆叠,形成立方体结构——在DRAM芯片上开设数千个细微孔,通过垂直贯通的电极连接上下芯片;底层则是DRAM逻辑控制单元,负责整体时序与控制。这种“叠罗汉”式的设计,使得HBM能够在极小的物理空间内实现极高的带宽密度。

两者在关键性能指标上的差距堪称代际:

带宽方面,传统DRAM(如DDR5)带宽约为50 - 100 GB/s,而HBM3E单堆叠带宽可达1.2 TB/s,下一代HBM4预计将提升至2.0 TB/s以上。HBM的带宽是传统DRAM的10倍以上。

功耗效率方面,HBM可低至5 pJ/bit以下,传统DRAM则为10 - 15 pJ/bit。在动辄数千张GPU同时运转的数据中心,这一差距意味着每年数千万美元的电费差异。

延迟方面,传统DRAM凭借平面架构优势可维持在10 ns级,而HBM因堆叠层数增加,延迟在100 ns级。但AI训练推理场景对“吞吐量”的敏感度远高于“单次延迟”——海量参数的高速吞吐远比单次访问的快慢更重要。

成本方面,HBM的生产成本远高于传统DRAM。HBM4单Gb成本虽较HBM3下降30%,但仍是同容量DDR5的3 - 5倍。HBM消耗的晶圆用量约为DDR5的4至5倍,TSV工艺使得HBM芯片的比特密度显著低于同规格DDR——SK海力士D1z DDR4的比特密度为0.296 Gb/mm²,比其HBM3(0.16 Gb/mm²)高出85%。TSV所需的额外面积和复杂的堆叠封装工艺,是HBM成本高企的核心原因。

简言之:传统DRAM追求“便宜够用”,HBM追求“极致带宽”——这是一场“成本优先”与“带宽优先”的技术路线之争

内存墙危机:为什么AI大模型非HBM不可?

AI大模型对HBM的依赖,根源在于一个被业界称为“内存墙”(Memory Wall)的根本性瓶颈。

过去20年间,GPU计算能力增长了6万倍,而DRAM带宽仅提升了100倍。算力提升速度远高于数据供给速度——就像一辆马力暴增的赛车,燃油管路却还是20年前的规格。GPU是引擎,HBM是燃油喷射系统;如果燃油供给速度跟不上,引擎马力再大也只能空转。

大语言模型的运行机制放大了这一矛盾。AI模型生成回答并非简单检索静态信息,而是持续维护一个包含上下文窗口、键值缓存(KV Cache)、中间激活和路由决策的“工作状态”。这些数据需以超低延迟实时访问且始终可用。在完整Token序列处理中,模型需持续访问并更新上下文——即便内存延迟轻微上升,也可能导致吞吐量下降、响应延迟,甚至迫使运营商增配硬件。

训练阶段,万亿参数的大模型需要在海量数据上反复迭代,每一次前向传播和反向传播都涉及巨量参数的读取与更新。HBM提供的TB/s级带宽,是缩短训练时间的决定性因素。

推理阶段,随着多模态大模型和AI Agent加速发展,Token调用量快速上升。推理应用的瓶颈往往不在于“算得有多快”,而在于“数据喂得有多快”。带宽的尽头就是HBM。

在系统层面,AI运行于分层内存架构之上:HBM为加速器提供数据,DRAM存储实时状态和对话记忆,基于NAND的SSD则为数据集、嵌入、检索索引、日志和检查点提供持久化存储。HBM处于最靠近计算核心的位置,承担着最高频、最紧急的数据供给任务——这是任何其他存储介质无法替代的。

正因如此,所有用于生成式AI训练和推理的领先AI加速器都使用HBM。HBM不是AI的“可选配件”,而是决定AI能走多快的“氧气瓶”。

供需失衡:一场持续数年的结构性短缺

HBM的需求是刚性的,供给却是“锁死的”。

需求端,2026年全球AI基础设施支出将达到4,500亿美元,其中推理算力占比首次超过70%,由此拉动GPU、HBM及高速网络芯片的强劲需求。2026年HBM需求增长主要由AI ASIC产能升级驱动,每颗AI芯片的HBM容量将从96 GB/192 GB大幅提升至216 GB/288 GB。英伟达Rubin平台虽单颗GPU的HBM容量与上代持平,但更高的出货量继续推高整体需求。全球九大云服务商2026年合计资本开支预计达约8,300亿美元,同比增长79%。

供给端,尽管三星、SK海力士、美光三大原厂已将70%的新增/可调配产能倾斜至HBM,但HBM产能缺口仍高达50%至60%。截至2026年首季,三大原厂的HBM产能已全部售罄。据SemiAnalysis数据,2026年DRAM供应低于需求约7%,HBM缺口6%、2027年扩大至9%。

更关键的是供给刚性。即便三大原厂现在决定扩产,受限于TSV工艺、先进封装良率、设备交付周期等物理约束,新增产能释放最快也要到2028 - 2029年。国际投行普遍认为HBM供不应求的结构性短缺至少将持续到2028年。英伟达CEO黄仁勋更明确表态:全球HBM供应短缺“根本不是短期市场波动,而会是一个持续数年的结构性行业困局”。

价格端,三星电子和SK海力士已将2026年HBM3E供应价格上调近20%。HBM4 12层初期合约价预计较2025年HBM3E 12层溢价10%以上。

市场格局:谁在主导这场存储革命?

HBM市场呈现极高的集中度。法人预测,SK海力士2026年出货市占率约52%,三星电子约39%,美光约8%,中国大陆业者维持极低比重。以销售额计算,SK海力士2026年HBM营收有望达59.5亿美元,稳居全球第一。

2026年首季全球HBM市场中,SK海力士市占率约51.4%。集邦科技预计其2026年全年HBM市占率可维持约50%;Counterpoint更预测其在HBM4市场的份额将达54%。

三大原厂的毛利率已突破70%甚至80%。HBM的利润分配呈“金字塔”结构——越靠近技术核心与瓶颈环节,分配比例越高。

与此同时,一个有趣的现象正在发生:通用型DRAM的盈利能力正在结构性反超HBM。截至2026年首季,通用型DRAM与HBM的营业利润率差距已扩大至逾15个百分点。市场测算显示,2026年将产能分配给通用DRAM,每片晶圆产生的营收已是HBM的两倍以上,毛利接近三倍。这正是SK海力士考虑将部分资源重新向通用DRAM倾斜的原因——但这恰恰印证了整个存储市场正处于全面性的景气高涨。

投资视角:HBM超级周期中的机会

HBM的结构性短缺与价格上行趋势,为投资者提供了清晰的产业逻辑支撑。

存储原厂是直接受益者。SK海力士(韩股)、三星电子(韩股)和美光(美股)凭借技术垄断和产能稀缺,赚取了产业链中的绝大部分超额利润。摩根士丹利基于DRAM均价至2026年上涨62%的预测,将存储原厂盈利预测上调56%至63%。

产业链上游同样受益。存储龙头的大规模扩产直接拉动刻蚀、薄膜沉积、测试等半导体设备需求,产业链景气度正从上游向中游传导。HBM的先进封装需求也推动了CoWoS等2.5D封装技术的产业化。

AI芯片厂商是HBM的最终需求方。英伟达(美股)、博通(美股)等AI芯片龙头对HBM的采购需求持续扩大。英伟达Rubin Ultra单颗GPU的HBM容量将提升至1 TB。

Gate股票交易:一站式参与全球存储与AI投资

对于希望参与这一轮存储超级周期的投资者,Gate股票提供了便捷的入市通道。

目前,Gate股票已形成覆盖美股、港股及韩股三大核心市场的7×24小时交易服务体系,支持超过10,000只美股及ETF、1,500余只港股及1,000余只韩股,合计覆盖全球超过12,500只股票及ETF资产。标的涵盖苹果、英伟达、微软、腾讯控股、小米集团、三星电子、SK海力士等全球代表性上市公司。

用户可通过Gate统一账户使用USDT一站式参与全球股票投资,支持最低0.01股起投的碎股交易,享有股息派发等权益。平台同时支持拆股、合股等公司行动服务,并已实现App与Web双端全面覆盖。

Gate股票在原有盘前、盘中及盘后交易基础上,进一步支持隔夜及周末交易,突破传统证券市场交易时间限制。券商间转仓服务也即将上线,将进一步提升用户股票资产管理的灵活性与便利性。

交易方式:用户在Gate平台完成统一账户充值后,即可在股票交易模块选择目标股票,以USDT计价进行买卖。平台提供实时行情、技术分析工具和订单类型选择(市价单、限价单等),操作流程与加密资产交易体验一致。

结语

HBM与DRAM的区别,本质上是“带宽优先”与“成本优先”两种技术路线的分野。在AI算力持续扩张的背景下,HBM凭借3D堆叠和TSV技术实现了对“内存墙”的突破,成为大模型训练与推理不可替代的核心组件。

2026年,全球半导体市场规模突破1.51万亿美元,存储芯片增长250%,HBM市场增长58%至546亿美元。产能缺口高达50%至60%,三大原厂产能全部售罄。这不是一轮普通的周期波动,而是由AI基础设施长期资本开支驱动的结构性变革。

对于投资者而言,存储原厂、设备材料、AI芯片三大链条均存在清晰的产业逻辑支撑。而Gate股票提供的7×24小时美港韩三股交易服务,为全球投资者参与这一轮存储超级周期提供了灵活高效的工具。在市场情绪极度恐惧(恐惧指数14 - 16)的当下,产业基本面与市场情绪之间的背离,往往孕育着最值得关注的结构性机会。

FAQ

Q1:HBM和DRAM的核心区别是什么?

HBM与传统DRAM的核心区别在于架构。传统DRAM采用平面架构,通过制程升级提升性能;HBM则采用3D堆叠技术,利用TSV硅通孔将多个DRAM裸片垂直堆叠,实现超宽数据路径。HBM3E带宽可达1.2 TB/s,是DDR5的10倍以上,但成本也是同容量DDR5的3 - 5倍。

Q2:为什么AI大模型必须使用HBM?

大模型训练和推理需要海量参数的高速读写。传统DRAM带宽增长远落后于算力提升(20年算力增6万倍,带宽仅增100倍),形成“内存墙”瓶颈。HBM凭借TB/s级带宽,能持续为GPU供给数据,避免算力空转。所有领先的AI加速器都使用HBM。

Q3:HBM市场的主要玩家有哪些?

HBM市场高度集中。SK海力士2026年出货市占率约52%,三星约39%,美光约8%。SK海力士以销售额计算稳居第一,2026年HBM营收有望达59.5亿美元。三大原厂2026年全部HBM产能已售罄,部分客户已将产能锁定至2028年。

Q4:HBM供不应求的状况会持续多久?

国际投行普遍认为HBM供不应求将至少持续到2028年。需求端受AI基础设施资本开支驱动,供给端受TSV工艺、封装良率、设备交付周期等物理约束。即便现在扩产,新增产能释放最快也要到2028 - 2029年。黄仁勋称这是“持续数年的结构性行业困局”。

Q5:如何在Gate平台投资HBM相关股票?

Gate股票支持美股、港股、韩股7×24小时交易,覆盖超12,500只股票及ETF。用户可通过统一账户使用USDT一站式投资,最低0.01股起投。HBM相关标的包括存储原厂SK海力士(韩股)、三星电子(韩股)、美光(美股),以及AI芯片厂商英伟达(美股)等。

BTC-1,00%
ETH0,46%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado