Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
CFD
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
CFD
Derivados de CFD de acciones estadounidenses
Acciones EE. UU.
Accede a acciones y ETF estadounidenses reales
Acciones HK
Opera con acciones de calidad cotizadas en Hong Kong
Acciones surcoreanas
SK Hynix
Opera con acciones surcoreanas reales e invierte en activos populares
Futuros de acciones
Alto apalancamiento, trading 24/7
Acciones tokenizadas
Respaldado por acciones reales
IPO Access
Accede al acceso completo a las OPV de acciones globales
GUSD
Acuña GUSD para obtener rendimientos de RWA del Tesoro
Actividades de acciones
Opera con acciones populares y desbloquea grandes airdrops
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
IPO Access
Accede al acceso completo a las OPV de acciones globales
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Centro de patrimonio VIP
Planes de aumento patrimonial prémium
Gate Wealth
Toma el control del futuro financiero
Quant Fund
Estrategias cuantitativas de alto nivel
Staking
Haz staking de criptomonedas para ganar en productos PoS
Apalancamiento inteligente
Apalancamiento sin liquidación
USD1 7% TAE
Sin bloqueo, opera y retira.
Promociones
Centro de actividades
Únete a actividades y gana recompensas
Referido
20 USDT
Invita amigos y gana por tus referidos
Programa de afiliados
Gana recompensas de comisión exclusivas
Gate Booster
Aumenta tu influencia y gana airdrops
Anuncio
Novedades de plataforma en tiempo real
Gate Blog
Artículos del sector de las criptomonedas
Servicios VIP
Grandes descuentos en tarifas
Gestión de activos
Solución integral para la gestión de activos
Institucional
Soluciones de activos digitales: empresas
Desarrolladores (API)
Conecta con el ecosistema de aplicaciones Gate
Transferencia bancaria OTC
Deposita y retira fiat
Programa de bróker
Reembolsos generosos mediante API
AI
Gate AI
Tu compañero de IA conversacional para todo
Gate AI Bot
Usa Gate AI directamente en tu aplicación social
GateClaw
Gate Blue Lobster, listo para usar
Gate for AI Agent
Infraestructura de IA, Gate MCP, Skills y CLI
Gate Skills Hub
+10 000 habilidades
De la oficina al trading, una biblioteca de habilidades todo en uno para sacar el máximo partido a la IA
HBM vs DRAM: ¿Por qué los grandes modelos de IA no pueden prescindir de ellos? Los chips de memoria pasan de la "era plana" a la "revolución 3D"
2026年6月30日,比特币在60,000美元附近窄幅震荡,以太坊维持在1,600美元区间。加密市场在经历6月以来的持续回调后,短期空头主导格局未改。但就在加密资产进入“垃圾时间”的同时,另一条赛道正经历前所未有的爆发式增长——半导体存储。
世界半导体贸易统计组织(WSTS)2026年春季报告大幅上调行业增长预期:2026年全球半导体市场规模或突破1.51万亿美元,同比增长90%,其中存储芯片同比增幅达250%,规模突破8,000亿美元。存储产值将首次超越晶圆代工,成为半导体第一增长极。
而这场存储革命的绝对主角,正是HBM(High Bandwidth Memory,高带宽内存)。2026年HBM市场规模预计增长58%至546亿美元,占DRAM市场近四成。HBM与DRAM究竟有什么区别?AI大模型为何对HBM如此依赖?
HBM与DRAM:同源不同命
HBM与DRAM共享同一种基础存储介质——动态随机存取存储器。但二者的技术路线、架构设计和应用场景,却走向了完全不同的方向。
传统DRAM走的是“平面扩张”路线。 以DDR4、DDR5为代表的传统DRAM采用平面架构,通过制程升级(如从20nm推进至2nm)和架构优化(如DDR5的预取位数提升)来提高性能。其核心逻辑是:在二维平面上不断缩小晶体管尺寸、提升频率。但这条路正逼近物理极限——2nm以下制程面临量子隧穿效应等难题,单靠制程微缩已无法满足AI算力对存储带宽的指数级需求。
HBM则选择了“垂直堆叠”的破局之路。 HBM采用3D结构,使用硅通孔(TSV)技术将数个DRAM裸片垂直堆叠,形成立方体结构——在DRAM芯片上开设数千个细微孔,通过垂直贯通的电极连接上下芯片;底层则是DRAM逻辑控制单元,负责整体时序与控制。这种“叠罗汉”式的设计,使得HBM能够在极小的物理空间内实现极高的带宽密度。
两者在关键性能指标上的差距堪称代际:
带宽方面,传统DRAM(如DDR5)带宽约为50 - 100 GB/s,而HBM3E单堆叠带宽可达1.2 TB/s,下一代HBM4预计将提升至2.0 TB/s以上。HBM的带宽是传统DRAM的10倍以上。
功耗效率方面,HBM可低至5 pJ/bit以下,传统DRAM则为10 - 15 pJ/bit。在动辄数千张GPU同时运转的数据中心,这一差距意味着每年数千万美元的电费差异。
延迟方面,传统DRAM凭借平面架构优势可维持在10 ns级,而HBM因堆叠层数增加,延迟在100 ns级。但AI训练推理场景对“吞吐量”的敏感度远高于“单次延迟”——海量参数的高速吞吐远比单次访问的快慢更重要。
成本方面,HBM的生产成本远高于传统DRAM。HBM4单Gb成本虽较HBM3下降30%,但仍是同容量DDR5的3 - 5倍。HBM消耗的晶圆用量约为DDR5的4至5倍,TSV工艺使得HBM芯片的比特密度显著低于同规格DDR——SK海力士D1z DDR4的比特密度为0.296 Gb/mm²,比其HBM3(0.16 Gb/mm²)高出85%。TSV所需的额外面积和复杂的堆叠封装工艺,是HBM成本高企的核心原因。
简言之:传统DRAM追求“便宜够用”,HBM追求“极致带宽”——这是一场“成本优先”与“带宽优先”的技术路线之争。
内存墙危机:为什么AI大模型非HBM不可?
AI大模型对HBM的依赖,根源在于一个被业界称为“内存墙”(Memory Wall)的根本性瓶颈。
过去20年间,GPU计算能力增长了6万倍,而DRAM带宽仅提升了100倍。算力提升速度远高于数据供给速度——就像一辆马力暴增的赛车,燃油管路却还是20年前的规格。GPU是引擎,HBM是燃油喷射系统;如果燃油供给速度跟不上,引擎马力再大也只能空转。
大语言模型的运行机制放大了这一矛盾。AI模型生成回答并非简单检索静态信息,而是持续维护一个包含上下文窗口、键值缓存(KV Cache)、中间激活和路由决策的“工作状态”。这些数据需以超低延迟实时访问且始终可用。在完整Token序列处理中,模型需持续访问并更新上下文——即便内存延迟轻微上升,也可能导致吞吐量下降、响应延迟,甚至迫使运营商增配硬件。
训练阶段,万亿参数的大模型需要在海量数据上反复迭代,每一次前向传播和反向传播都涉及巨量参数的读取与更新。HBM提供的TB/s级带宽,是缩短训练时间的决定性因素。
推理阶段,随着多模态大模型和AI Agent加速发展,Token调用量快速上升。推理应用的瓶颈往往不在于“算得有多快”,而在于“数据喂得有多快”。带宽的尽头就是HBM。
在系统层面,AI运行于分层内存架构之上:HBM为加速器提供数据,DRAM存储实时状态和对话记忆,基于NAND的SSD则为数据集、嵌入、检索索引、日志和检查点提供持久化存储。HBM处于最靠近计算核心的位置,承担着最高频、最紧急的数据供给任务——这是任何其他存储介质无法替代的。
正因如此,所有用于生成式AI训练和推理的领先AI加速器都使用HBM。HBM不是AI的“可选配件”,而是决定AI能走多快的“氧气瓶”。
供需失衡:一场持续数年的结构性短缺
HBM的需求是刚性的,供给却是“锁死的”。
需求端,2026年全球AI基础设施支出将达到4,500亿美元,其中推理算力占比首次超过70%,由此拉动GPU、HBM及高速网络芯片的强劲需求。2026年HBM需求增长主要由AI ASIC产能升级驱动,每颗AI芯片的HBM容量将从96 GB/192 GB大幅提升至216 GB/288 GB。英伟达Rubin平台虽单颗GPU的HBM容量与上代持平,但更高的出货量继续推高整体需求。全球九大云服务商2026年合计资本开支预计达约8,300亿美元,同比增长79%。
供给端,尽管三星、SK海力士、美光三大原厂已将70%的新增/可调配产能倾斜至HBM,但HBM产能缺口仍高达50%至60%。截至2026年首季,三大原厂的HBM产能已全部售罄。据SemiAnalysis数据,2026年DRAM供应低于需求约7%,HBM缺口6%、2027年扩大至9%。
更关键的是供给刚性。即便三大原厂现在决定扩产,受限于TSV工艺、先进封装良率、设备交付周期等物理约束,新增产能释放最快也要到2028 - 2029年。国际投行普遍认为HBM供不应求的结构性短缺至少将持续到2028年。英伟达CEO黄仁勋更明确表态:全球HBM供应短缺“根本不是短期市场波动,而会是一个持续数年的结构性行业困局”。
价格端,三星电子和SK海力士已将2026年HBM3E供应价格上调近20%。HBM4 12层初期合约价预计较2025年HBM3E 12层溢价10%以上。
市场格局:谁在主导这场存储革命?
HBM市场呈现极高的集中度。法人预测,SK海力士2026年出货市占率约52%,三星电子约39%,美光约8%,中国大陆业者维持极低比重。以销售额计算,SK海力士2026年HBM营收有望达59.5亿美元,稳居全球第一。
2026年首季全球HBM市场中,SK海力士市占率约51.4%。集邦科技预计其2026年全年HBM市占率可维持约50%;Counterpoint更预测其在HBM4市场的份额将达54%。
三大原厂的毛利率已突破70%甚至80%。HBM的利润分配呈“金字塔”结构——越靠近技术核心与瓶颈环节,分配比例越高。
与此同时,一个有趣的现象正在发生:通用型DRAM的盈利能力正在结构性反超HBM。截至2026年首季,通用型DRAM与HBM的营业利润率差距已扩大至逾15个百分点。市场测算显示,2026年将产能分配给通用DRAM,每片晶圆产生的营收已是HBM的两倍以上,毛利接近三倍。这正是SK海力士考虑将部分资源重新向通用DRAM倾斜的原因——但这恰恰印证了整个存储市场正处于全面性的景气高涨。
投资视角:HBM超级周期中的机会
HBM的结构性短缺与价格上行趋势,为投资者提供了清晰的产业逻辑支撑。
存储原厂是直接受益者。SK海力士(韩股)、三星电子(韩股)和美光(美股)凭借技术垄断和产能稀缺,赚取了产业链中的绝大部分超额利润。摩根士丹利基于DRAM均价至2026年上涨62%的预测,将存储原厂盈利预测上调56%至63%。
产业链上游同样受益。存储龙头的大规模扩产直接拉动刻蚀、薄膜沉积、测试等半导体设备需求,产业链景气度正从上游向中游传导。HBM的先进封装需求也推动了CoWoS等2.5D封装技术的产业化。
AI芯片厂商是HBM的最终需求方。英伟达(美股)、博通(美股)等AI芯片龙头对HBM的采购需求持续扩大。英伟达Rubin Ultra单颗GPU的HBM容量将提升至1 TB。
Gate股票交易:一站式参与全球存储与AI投资
对于希望参与这一轮存储超级周期的投资者,Gate股票提供了便捷的入市通道。
目前,Gate股票已形成覆盖美股、港股及韩股三大核心市场的7×24小时交易服务体系,支持超过10,000只美股及ETF、1,500余只港股及1,000余只韩股,合计覆盖全球超过12,500只股票及ETF资产。标的涵盖苹果、英伟达、微软、腾讯控股、小米集团、三星电子、SK海力士等全球代表性上市公司。
用户可通过Gate统一账户使用USDT一站式参与全球股票投资,支持最低0.01股起投的碎股交易,享有股息派发等权益。平台同时支持拆股、合股等公司行动服务,并已实现App与Web双端全面覆盖。
Gate股票在原有盘前、盘中及盘后交易基础上,进一步支持隔夜及周末交易,突破传统证券市场交易时间限制。券商间转仓服务也即将上线,将进一步提升用户股票资产管理的灵活性与便利性。
交易方式:用户在Gate平台完成统一账户充值后,即可在股票交易模块选择目标股票,以USDT计价进行买卖。平台提供实时行情、技术分析工具和订单类型选择(市价单、限价单等),操作流程与加密资产交易体验一致。
结语
HBM与DRAM的区别,本质上是“带宽优先”与“成本优先”两种技术路线的分野。在AI算力持续扩张的背景下,HBM凭借3D堆叠和TSV技术实现了对“内存墙”的突破,成为大模型训练与推理不可替代的核心组件。
2026年,全球半导体市场规模突破1.51万亿美元,存储芯片增长250%,HBM市场增长58%至546亿美元。产能缺口高达50%至60%,三大原厂产能全部售罄。这不是一轮普通的周期波动,而是由AI基础设施长期资本开支驱动的结构性变革。
对于投资者而言,存储原厂、设备材料、AI芯片三大链条均存在清晰的产业逻辑支撑。而Gate股票提供的7×24小时美港韩三股交易服务,为全球投资者参与这一轮存储超级周期提供了灵活高效的工具。在市场情绪极度恐惧(恐惧指数14 - 16)的当下,产业基本面与市场情绪之间的背离,往往孕育着最值得关注的结构性机会。
FAQ
Q1:HBM和DRAM的核心区别是什么?
HBM与传统DRAM的核心区别在于架构。传统DRAM采用平面架构,通过制程升级提升性能;HBM则采用3D堆叠技术,利用TSV硅通孔将多个DRAM裸片垂直堆叠,实现超宽数据路径。HBM3E带宽可达1.2 TB/s,是DDR5的10倍以上,但成本也是同容量DDR5的3 - 5倍。
Q2:为什么AI大模型必须使用HBM?
大模型训练和推理需要海量参数的高速读写。传统DRAM带宽增长远落后于算力提升(20年算力增6万倍,带宽仅增100倍),形成“内存墙”瓶颈。HBM凭借TB/s级带宽,能持续为GPU供给数据,避免算力空转。所有领先的AI加速器都使用HBM。
Q3:HBM市场的主要玩家有哪些?
HBM市场高度集中。SK海力士2026年出货市占率约52%,三星约39%,美光约8%。SK海力士以销售额计算稳居第一,2026年HBM营收有望达59.5亿美元。三大原厂2026年全部HBM产能已售罄,部分客户已将产能锁定至2028年。
Q4:HBM供不应求的状况会持续多久?
国际投行普遍认为HBM供不应求将至少持续到2028年。需求端受AI基础设施资本开支驱动,供给端受TSV工艺、封装良率、设备交付周期等物理约束。即便现在扩产,新增产能释放最快也要到2028 - 2029年。黄仁勋称这是“持续数年的结构性行业困局”。
Q5:如何在Gate平台投资HBM相关股票?
Gate股票支持美股、港股、韩股7×24小时交易,覆盖超12,500只股票及ETF。用户可通过统一账户使用USDT一站式投资,最低0.01股起投。HBM相关标的包括存储原厂SK海力士(韩股)、三星电子(韩股)、美光(美股),以及AI芯片厂商英伟达(美股)等。El 30 de junio de 2026, Bitcoin se mantiene en un rango estrecho cerca de los 60,000 dólares, mientras que Ethereum se mantiene en el rango de los 1,600 dólares. El mercado de criptomonedas, tras la corrección continua desde junio, aún no ha cambiado su patrón dominado por los bajistas a corto plazo. Pero justo cuando los activos cripto entran en un "tiempo muerto", otra pista está experimentando un crecimiento explosivo sin precedentes: la memoria de semiconductores.
La Organización Mundial de Estadísticas de Comercio de Semiconductores (WSTS) elevó significativamente sus previsiones de crecimiento en su informe de primavera de 2026: se espera que el mercado mundial de semiconductores supere los 1,51 billones de dólares en 2026, un incremento interanual del 90%, con un crecimiento interanual del 250% en chips de memoria, superando los 800.000 millones de dólares. Por primera vez, el valor de producción de la memoria superará al de la fundición de obleas, convirtiéndose en el primer motor de crecimiento del sector.
Y el protagonista absoluto de esta revolución de la memoria es la HBM (High Bandwidth Memory, memoria de alto ancho de banda). Se espera que el mercado de HBM en 2026 crezca un 58% hasta los 54.600 millones de dólares, representando casi el 40% del mercado de DRAM. ¿Cuál es exactamente la diferencia entre HBM y DRAM? ¿Por qué los grandes modelos de IA dependen tanto de la HBM?
HBM y DRAM: Mismo origen, diferente destino
HBM y DRAM comparten el mismo medio de almacenamiento básico: la memoria dinámica de acceso aleatorio (DRAM). Pero sus rutas tecnológicas, diseño arquitectónico y escenarios de aplicación han tomado direcciones completamente diferentes.
La DRAM tradicional sigue la ruta de "expansión plana". La DRAM tradicional, representada por DDR4 y DDR5, adopta una arquitectura plana y mejora el rendimiento mediante la mejora del proceso (por ejemplo, de 20 nm a 2 nm) y la optimización arquitectónica (como el aumento de bits de prefetch en DDR5). Su lógica central es reducir continuamente el tamaño del transistor y aumentar la frecuencia en un plano bidimensional. Pero este camino se acerca a sus límites físicos: los procesos por debajo de 2 nm enfrentan problemas como el efecto túnel cuántico, y la simple reducción del proceso ya no puede satisfacer la demanda exponencial de ancho de banda de memoria para la computación de IA.
La HBM, por otro lado, eligió el camino innovador del "apilamiento vertical". La HBM adopta una estructura 3D, utilizando la tecnología de silicio a través de vías (TSV) para apilar verticalmente varios chips DRAM, formando una estructura cúbica: se abren miles de microagujeros en el chip DRAM, conectando los chips superior e inferior mediante electrodos verticales; la capa inferior es la unidad de control lógico DRAM, responsable de la temporización y el control general. Este diseño de "torre humana" permite a la HBM lograr una densidad de ancho de banda extremadamente alta en un espacio físico muy pequeño.
La brecha en los indicadores clave de rendimiento entre ambos es generacional:
En términos de ancho de banda, la DRAM tradicional (como DDR5) tiene un ancho de banda de aproximadamente 50-100 GB/s, mientras que un solo apilamiento de HBM3E puede alcanzar 1,2 TB/s, y se espera que la próxima generación, HBM4, supere los 2,0 TB/s. El ancho de banda de HBM es más de 10 veces el de la DRAM tradicional.
En eficiencia energética, la HBM puede ser inferior a 5 pJ/bit, mientras que la DRAM tradicional es de 10-15 pJ/bit. En centros de datos con miles de GPU funcionando simultáneamente, esta diferencia significa decenas de millones de dólares en costos de electricidad al año.
En latencia, la DRAM tradicional puede mantenerse en el rango de 10 ns gracias a su arquitectura plana, mientras que la HBM, debido al aumento del número de capas apiladas, tiene una latencia en el rango de 100 ns. Sin embargo, en escenarios de entrenamiento e inferencia de IA, la sensibilidad al "rendimiento" es mucho mayor que a la "latencia única": el alto rendimiento de grandes cantidades de parámetros es más importante que la velocidad de un solo acceso.
En costos, el costo de producción de HBM es mucho mayor que el de la DRAM tradicional. Aunque el costo por Gb de HBM4 ha disminuido un 30% en comparación con HBM3, sigue siendo de 3 a 5 veces el de DDR5 de la misma capacidad. El consumo de obleas de HBM es aproximadamente de 4 a 5 veces el de DDR5, y el proceso TSV hace que la densidad de bits de los chips HBM sea significativamente menor que la de DDR equivalente: la densidad de bits de SK Hynix D1z DDR4 es de 0,296 Gb/mm², un 85% más alta que su HBM3 (0,16 Gb/mm²). El área adicional requerida por TSV y el complejo proceso de empaquetado apilado son las razones principales del alto costo de HBM.
En resumen: La DRAM tradicional busca "barato y suficiente", mientras que la HBM busca "ancho de banda extremo" — esta es una disputa entre las rutas tecnológicas de "prioridad de costo" y "prioridad de ancho de banda".
La crisis del muro de memoria: ¿Por qué los grandes modelos de IA necesitan HBM?
La dependencia de los grandes modelos de IA de la HBM tiene su origen en un cuello de botella fundamental conocido en la industria como el "muro de memoria" (Memory Wall).
En los últimos 20 años, la capacidad de cómputo de las GPU ha aumentado 60.000 veces, mientras que el ancho de banda de la DRAM solo se ha multiplicado por 100. La velocidad de mejora de la potencia de cómputo supera con creces la velocidad de suministro de datos, como un coche de carreras con una potencia explosiva pero con un sistema de combustible de hace 20 años. La GPU es el motor, la HBM es el sistema de inyección de combustible; si la velocidad de suministro de combustible no sigue el ritmo, por mucha potencia que tenga el motor, solo girará en vacío.
El mecanismo de funcionamiento de los modelos de lenguaje grandes amplifica esta contradicción. Los modelos de IA no generan respuestas simplemente recuperando información estática, sino que mantienen continuamente un "estado de trabajo" que incluye la ventana de contexto, la caché de claves y valores (KV Cache), las activaciones intermedias y las decisiones de enrutamiento. Estos datos deben ser accesibles en tiempo real con latencia ultrabaja y estar siempre disponibles. En el procesamiento de secuencias completas de tokens, el modelo necesita acceder y actualizar continuamente el contexto; incluso un ligero aumento en la latencia de la memoria puede provocar una disminución del rendimiento, retrasos en la respuesta, e incluso obligar a los operadores a añadir más hardware.
En la fase de entrenamiento, los grandes modelos con billones de parámetros necesitan iterar repetidamente sobre enormes cantidades de datos, y cada propagación hacia adelante y hacia atrás implica la lectura y actualización de una gran cantidad de parámetros. El ancho de banda de nivel TB/s que ofrece la HBM es el factor decisivo para acortar el tiempo de entrenamiento.
En la fase de inferencia, con el rápido desarrollo de los grandes modelos multimodales y los agentes de IA, el volumen de llamadas de tokens está aumentando rápidamente. El cuello de botella de las aplicaciones de inferencia a menudo no está en "lo rápido que se calcula", sino en "lo rápido que se alimentan los datos". El final del ancho de banda es la HBM.
A nivel de sistema, la IA se ejecuta sobre una arquitectura de memoria jerárquica: la HBM proporciona datos a los aceleradores, la DRAM almacena el estado en tiempo real y la memoria de la conversación, y los SSD basados en NAND proporcionan almacenamiento persistente para conjuntos de datos, incrustaciones, índices de búsqueda, registros y puntos de control. La HBM está en la posición más cercana al núcleo de computación, asumiendo las tareas de suministro de datos más frecuentes y urgentes — esto es insustituible por cualquier otro medio de almacenamiento.
Por esta razón, todos los principales aceleradores de IA utilizados para el entrenamiento y la inferencia de IA generativa utilizan HBM. La HBM no es un "accesorio opcional" para la IA, sino el "tanque de oxígeno" que determina lo rápido que puede avanzar la IA.
Desequilibrio entre oferta y demanda: Una escasez estructural que durará años
La demanda de HBM es rígida, pero la oferta está "bloqueada".
En el lado de la demanda, el gasto global en infraestructura de IA alcanzará los 450.000 millones de dólares en 2026, con la potencia de cómputo de inferencia representando por primera vez más del 70%, impulsando así una fuerte demanda de GPU, HBM y chips de red de alta velocidad. El crecimiento de la demanda de HBM en 2026 está impulsado principalmente por la actualización de la capacidad de los ASIC de IA, con la capacidad de HBM por chip de IA aumentando significativamente de 96 GB/192 GB a 216 GB/288 GB. Aunque la plataforma Rubin de Nvidia mantiene la misma capacidad de HBM por GPU que la generación anterior, los mayores volúmenes de envío siguen impulsando la demanda general. Se espera que el gasto de capital total de los nueve principales proveedores de servicios en la nube en 2026 alcance aproximadamente los 830.000 millones de dólares, un aumento interanual del 79%.
En el lado de la oferta, aunque los tres principales fabricantes (Samsung, SK Hynix y Micron) han destinado el 70% de su nueva capacidad/capacidad asignable a HBM, la brecha de capacidad de HBM sigue siendo del 50% al 60%. A partir del primer trimestre de 2026, la capacidad de HBM de los tres principales fabricantes ya está completamente agotada. Según datos de SemiAnalysis, la oferta de DRAM en 2026 será aproximadamente un 7% inferior a la demanda, con una brecha de HBM del 6%, que se ampliará al 9% en 2027.
Más crítico es la rigidez de la oferta. Incluso si los tres principales fabricantes deciden ahora aumentar la capacidad, debido a limitaciones físicas como el proceso TSV, el rendimiento del empaquetado avanzado y el ciclo de entrega de equipos, la nueva capacidad tardará como mínimo hasta 2028-2029 en materializarse. Los bancos de inversión internacionales creen unánimemente que la escasez estructural de HBM (oferta insuficiente para la demanda) durará al menos hasta 2028. El CEO de Nvidia, Jensen Huang, declaró explícitamente que la escasez global de suministro de HBM "no es una fluctuación del mercado a corto plazo, sino un problema estructural de la industria que durará varios años".
En el lado de los precios, Samsung Electronics y SK Hynix ya han aumentado los precios de suministro de HBM3E para 2026 en casi un 20%. Se espera que el precio inicial del contrato para HBM4 de 12 capas tenga una prima superior al 10% en comparación con HBM3E de 12 capas en 2025.
Panorama del mercado: ¿Quién lidera esta revolución de la memoria?
El mercado de HBM muestra una concentración extremadamente alta. Las instituciones financieras pronostican que SK Hynix tendrá una cuota de mercado de envíos de aproximadamente el 52% en 2026, Samsung Electronics alrededor del 39% y Micron alrededor del 8%, mientras que los actores de China continental mantendrán una proporción muy baja. En términos de ingresos, se espera que SK Hynix genere unos ingresos de HBM de 5.950 millones de dólares en 2026, manteniéndose como líder mundial.
En el primer trimestre de 2026, la cuota de mercado de SK Hynix en el mercado global de HBM fue de aproximadamente el 51,4%. TrendForce espera que su cuota de mercado de HBM para todo el año 2026 se mantenga en torno al 50%; Counterpoint incluso predice que su cuota en el mercado de HBM4 alcanzará el 54%.
Los márgenes brutos de los tres principales fabricantes ya han superado el 70% e incluso el 80%. La distribución de beneficios de HBM tiene una estructura de "pirámide": cuanto más cerca del núcleo tecnológico y del cuello de botella, mayor es la proporción de distribución.
Al mismo tiempo, se está produciendo un fenómeno interesante: la rentabilidad de la DRAM de propósito general está superando estructuralmente a la de la HBM. A partir del primer trimestre de 2026, la diferencia en el margen de beneficio operativo entre la DRAM de uso general y la HBM se ha ampliado a más de 15 puntos porcentuales. Los cálculos del mercado muestran que, en 2026, asignar capacidad a la DRAM de uso general genera más del doble de ingresos por oblea que la HBM, y casi el triple de margen bruto. Esta es la razón por la que SK Hynix está considerando reasignar algunos recursos a la DRAM de uso general, pero esto precisamente confirma que todo el mercado de almacenamiento se encuentra en un auge generalizado.
Perspectiva de inversión: Oportunidades en el superciclo de HBM
La escasez estructural de HBM y la tendencia alcista de los precios proporcionan un claro soporte lógico industrial para los inversores.
Los fabricantes de memoria originales son los beneficiarios directos. SK Hynix (acción coreana), Samsung Electronics (acción coreana) y Micron (acción estadounidense), gracias a su monopolio tecnológico y la escasez de capacidad, obtienen la gran mayoría de los beneficios extraordinarios de la cadena industrial. Morgan Stanley, basándose en la predicción de que el precio medio de la DRAM aumentará un 62% hasta 2026, ha elevado las previsiones de beneficios de los fabricantes de memoria originales entre un 56% y un 63%.
La cadena de suministro ascendente también se beneficia. La expansión masiva de la capacidad por parte de los líderes del almacenamiento impulsa directamente la demanda de equipos de semiconductores como grabado, deposición de películas delgadas y pruebas, y el ciclo de auge de la cadena industrial se está transmitiendo de aguas arriba a aguas medias. La demanda de empaquetado avanzado de HBM también ha impulsado la industrialización de tecnologías de empaquetado 2.5D como CoWoS.
Los fabricantes de chips de IA son los demandantes finales de HBM. Los principales fabricantes de chips de IA como Nvidia (acción estadounidense) y Broadcom (acción estadounidense) continúan expandiendo su demanda de adquisición de HBM. La capacidad de HBM por GPU de Nvidia Rubin Ultra se incrementará a 1 TB.
Gate Stock Trading: Participación integral en la inversión global en almacenamiento e IA
Para los inversores que deseen participar en este superciclo de almacenamiento, Gate Stock ofrece un acceso conveniente al mercado.
Actualmente, Gate Stock ha establecido un sistema de servicios de negociación 7×24 horas que cubre los tres mercados principales de EE. UU., Hong Kong y Corea del Sur, admitiendo más de 10.000 acciones y ETF estadounidenses, más de 1.500 acciones de Hong Kong y más de 1.000 acciones coreanas, cubriendo en total más de 12.500 acciones y activos ETF a nivel mundial. Los activos incluyen empresas representativas que cotizan en bolsa como Apple, Nvidia, Microsoft, Tencent Holdings, Xiaomi Group, Samsung Electronics y SK Hynix.
Los usuarios pueden participar en inversiones en acciones globales de forma integral utilizando USDT a través de una cuenta unificada de Gate, con soporte para negociación de acciones fraccionarias desde un mínimo de 0,01 acciones y disfrute de derechos como el pago de dividendos. La plataforma también admite servicios de acciones corporativas como splits y consolidaciones, y ya cuenta con cobertura completa tanto en la aplicación como en la web.
Sobre la base de la negociación previa a la apertura, durante la sesión y posterior al cierre, Gate Stock también admite la negociación nocturna y los fines de semana, rompiendo las limitaciones de tiempo de negociación de los mercados de valores tradicionales. El servicio de transferencia de valores entre corredores también estará disponible próximamente, mejorando aún más la flexibilidad y conveniencia de la gestión de activos de acciones de los usuarios.
Método de negociación: Después de recargar su cuenta unificada en la plataforma Gate, los usuarios pueden seleccionar la acción deseada en el módulo de negociación de acciones y comprar o vender con precio en USDT. La plataforma proporciona cotizaciones en tiempo real, herramientas de análisis técnico y selección de tipos de órdenes (órdenes de mercado, órdenes limitadas, etc.), con un proceso operativo consistente con la experiencia de negociación de criptoactivos.
Conclusión
La diferencia entre HBM y DRAM es esencialmente una divergencia entre dos rutas tecnológicas: "prioridad de ancho de banda" versus "prioridad de costo". En el contexto de la expansión continua de la potencia de cómputo de IA, la HBM, con su apilamiento 3D y la tecnología TSV, ha logrado superar el "muro de memoria", convirtiéndose en un componente central insustituible para el entrenamiento y la inferencia de grandes modelos.
En 2026, el mercado mundial de semiconductores superará los 1,51 billones de dólares, los chips de memoria crecerán un 250% y el mercado de HBM crecerá un 58% hasta los 54.600 millones de dólares. La brecha de capacidad es del 50% al 60%, y toda la capacidad de los tres principales fabricantes está agotada. Esto no es un ciclo de fluctuación ordinario, sino un cambio estructural impulsado por el gasto de capital a largo plazo en infraestructura de IA.
Para los inversores, las tres cadenas de fabricantes de memoria originales, equipos y materiales, y chips de IA cuentan con un claro soporte lógico industrial. Y el servicio de negociación 7×24 horas de acciones de EE. UU., Hong Kong y Corea del Sur que ofrece Gate Stock proporciona una herramienta flexible y eficiente para que los inversores globales participen en este superciclo de almacenamiento. En el momento actual de miedo extremo en el mercado (índice de miedo 14-16), la divergencia entre los fundamentos de la industria y el sentimiento del mercado a menudo genera las oportunidades estructurales más dignas de atención.
FAQ
P1: ¿Cuál es la diferencia principal entre HBM y DRAM?
La diferencia principal entre HBM y la DRAM tradicional radica en la arquitectura. La DRAM tradicional adopta una arquitectura plana y mejora el rendimiento mediante la mejora del proceso; la HBM, por otro lado, utiliza tecnología de apilamiento 3D, apilando verticalmente múltiples chips DRAM mediante vías de silicio (TSV) para lograr rutas de datos ultra anchas. El ancho de banda de HBM3E puede alcanzar 1,2 TB/s, más de 10 veces el de DDR5, pero su costo también es de 3 a 5 veces el de DDR5 de la misma capacidad.
P2: ¿Por qué los grandes modelos de IA deben usar HBM?
El entrenamiento y la inferencia de grandes modelos requieren la lectura y escritura de alta velocidad de enormes cantidades de parámetros. El crecimiento del ancho de banda de la DRAM tradicional está muy por detrás del aumento de la potencia de cómputo (la potencia de cómputo se ha multiplicado por 60.000 en 20 años, mientras que el ancho de banda solo se ha multiplicado por 100), formando un cuello de botella conocido como "muro de memoria". La HBM, con su ancho de banda de nivel TB/s, puede suministrar datos continuamente a la GPU, evitando que la potencia de cómputo gire en vacío. Todos los principales aceleradores de IA utilizan HBM.
P3: ¿Cuáles son los principales actores en el mercado de HBM?
El mercado de HBM está altamente concentrado. Se espera que SK Hynix tenga una cuota de mercado de envíos de aproximadamente el 52% en 2026, Samsung alrededor del 39% y Micron alrededor del 8%. SK Hynix es el líder indiscutible en términos de ingresos, con unos ingresos de HBM que se espera alcancen los 5.950 millones de dólares en 2026. Toda la capacidad de HBM de los tres principales fabricantes para 2026 ya está agotada, y algunos clientes han asegurado la capacidad hasta 2028.
P4: ¿Cuánto durará la situación de escasez de oferta de HBM?
Los bancos de inversión internacionales creen unánimemente que la escasez de oferta de HBM durará al menos hasta 2028. El lado de la demanda está impulsado por el gasto de capital en infraestructura de IA, mientras que el lado de la oferta está restringido por limitaciones físicas como el proceso TSV, el rendimiento del empaquetado y el ciclo de entrega de equipos. Incluso si se amplía la capacidad ahora, la nueva capacidad tardaría como mínimo hasta 2028-2029 en materializarse. Jensen Huang lo ha calificado como "un problema estructural de la industria que durará varios años".
P5: ¿Cómo invertir en acciones relacionadas con HBM en la plataforma Gate?
Gate Stock admite la negociación 7×24 horas de acciones de EE. UU., Hong Kong y Corea del Sur, cubriendo más de 12.500 acciones y ETF. Los usuarios pueden invertir de forma integral utilizando USDT a través de una cuenta unificada, con una inversión mínima de 0,01 acciones. Los activos relacionados con HBM incluyen los fabricantes de memoria originales SK Hynix (acción coreana), Samsung Electronics (acción coreana), Micron (acción estadounidense), así como el fabricante de chips de IA Nvidia (acción estadounidense), entre otros.