HBM vs DRAM: por que a IA de grandes modelos não pode prescindir dele? Os chips de memória passam da "era plana" para a "revolução 3D".

Em 30 de junho de 2026, o Bitcoin oscila lateralmente perto de US$ 60.000, enquanto o Ethereum se mantém na faixa dos US$ 1.600. Após uma correção contínua desde junho, o mercado de criptomoedas ainda não alterou o cenário de domínio de curto prazo dos baixistas. Mas, enquanto os ativos cripto entram em um "período de baixa atividade", outra pista está passando por um crescimento explosivo sem precedentes — a memória semicondutora.

O relatório de primavera de 2026 da Organização Mundial de Estatísticas de Comércio de Semicondutores (WSTS) revisou para cima as expectativas de crescimento do setor: o mercado global de semicondutores em 2026 pode ultrapassar US$ 1,51 trilhão, com crescimento de 90% em relação ao ano anterior, dos quais os chips de memória terão um aumento de 250%, ultrapassando US$ 800 bilhões. Pela primeira vez, a produção de memória superará a de fundição de wafer, tornando-se o principal motor de crescimento dos semicondutores.

E o protagonista absoluto dessa revolução da memória é a HBM (High Bandwidth Memory, memória de alta largura de banda). Em 2026, o mercado de HBM deve crescer 58%, alcançando US$ 54,6 bilhões, representando quase 40% do mercado de DRAM. Qual é a diferença entre HBM e DRAM? Por que os grandes modelos de IA dependem tanto da HBM?

HBM vs DRAM: Mesma origem, destinos diferentes

HBM e DRAM compartilham o mesmo meio de armazenamento básico — a memória dinâmica de acesso aleatório (DRAM). No entanto, suas rotas tecnológicas, arquiteturas e cenários de aplicação seguiram direções completamente diferentes.

A DRAM tradicional segue a rota de "expansão planar". DRAMs tradicionais como DDR4 e DDR5 adotam arquitetura planar, melhorando o desempenho por meio de avanços no processo de fabricação (por exemplo, de 20nm para 2nm) e otimizações de arquitetura (como aumento do pré-busca no DDR5). Sua lógica central é miniaturizar continuamente os transistores em um plano bidimensional e aumentar a frequência. Mas esse caminho está se aproximando de seus limites físicos — processos abaixo de 2nm enfrentam problemas como tunelamento quântico, e a simples miniaturização do processo não consegue mais atender à demanda exponencial de largura de banda exigida pela computação de IA.

A HBM, por outro lado, escolheu o caminho de "empilhamento vertical" para romper barreiras. A HBM adota uma estrutura 3D, usando a tecnologia Through-Silicon Via (TSV) para empilhar verticalmente várias pastilhas DRAM, formando uma estrutura cúbica — milhares de microfuros são abertos na pastilha DRAM, conectando as pastilhas superior e inferior por meio de eletrodos verticais contínuos; na base, há uma unidade de controle lógico DRAM responsável pela temporização e controle gerais. Esse design de "empilhamento" permite que a HBM alcance uma densidade de largura de banda extremamente alta em um espaço físico muito pequeno.

A diferença nos principais indicadores de desempenho entre os dois é geracional:

Em termos de largura de banda, a DRAM tradicional (como DDR5) tem largura de banda de cerca de 50-100 GB/s, enquanto a HBM3E pode atingir 1,2 TB/s por empilhamento, e a próxima geração HBM4 deve ultrapassar 2,0 TB/s. A largura de banda da HBM é mais de 10 vezes a da DRAM tradicional.

Em eficiência energética, a HBM pode chegar a menos de 5 pJ/bit, enquanto a DRAM tradicional fica entre 10-15 pJ/bit. Em data centers com milhares de GPUs operando simultaneamente, essa diferença representa milhões de dólares em custos de eletricidade por ano.

Em latência, a DRAM tradicional, devido à sua arquitetura planar, pode manter latência na faixa de 10 ns, enquanto a HBM, por ter mais camadas empilhadas, tem latência na faixa de 100 ns. No entanto, em cenários de treinamento e inferência de IA, a sensibilidade à "taxa de transferência" é muito maior do que à "latência única" — a alta taxa de transferência de parâmetros massivos é mais importante do que a velocidade de um único acesso.

Em custo, o custo de produção da HBM é muito maior do que o da DRAM tradicional. Embora o custo por Gb da HBM4 seja 30% menor que o da HBM3, ainda é 3 a 5 vezes o custo do DDR5 com a mesma capacidade. A HBM consome cerca de 4 a 5 vezes mais wafers do que o DDR5, e o processo TSV reduz significativamente a densidade de bits da HBM em comparação com DDR de especificação similar — a densidade de bits do DDR4 D1z da SK Hynix é de 0,296 Gb/mm², 85% maior que a de sua HBM3 (0,16 Gb/mm²). A área adicional necessária para TSV e o complexo processo de empacotamento e empilhamento são as principais razões para o alto custo da HBM.

Em resumo: a DRAM tradicional busca "barato e suficiente", enquanto a HBM busca "largura de banda máxima" — esta é uma disputa entre "prioridade de custo" e "prioridade de largura de banda".

A crise do Memory Wall: por que os grandes modelos de IA precisam da HBM?

A dependência dos grandes modelos de IA em relação à HBM tem raízes em um gargalo fundamental conhecido como "Memory Wall" (Parede de Memória).

Nos últimos 20 anos, a capacidade de computação das GPUs cresceu 60.000 vezes, enquanto a largura de banda da DRAM aumentou apenas 100 vezes. A taxa de aumento da capacidade de computação é muito maior do que a taxa de fornecimento de dados — como um carro de corrida com potência explosiva, mas com o mesmo sistema de abastecimento de combustível de 20 anos atrás. A GPU é o motor, a HBM é o sistema de injeção de combustível; se o fornecimento de combustível não acompanhar, o motor, por mais potente que seja, só pode girar em falso.

O mecanismo de operação dos grandes modelos de linguagem amplifica essa contradição. A geração de respostas por modelos de IA não é simplesmente uma recuperação de informações estáticas, mas a manutenção contínua de um "estado de trabalho" que inclui janela de contexto, cache KV (Key-Value Cache), ativações intermediárias e decisões de roteamento. Esses dados precisam ser acessados em tempo real com latência ultrabaixa e estar sempre disponíveis. Durante o processamento de uma sequência completa de tokens, o modelo precisa acessar e atualizar continuamente o contexto — mesmo um leve aumento na latência da memória pode levar a uma queda na taxa de transferência, atraso na resposta e até forçar os operadores a adicionar mais hardware.

Na fase de treinamento, grandes modelos com trilhões de parâmetros precisam iterar repetidamente sobre enormes volumes de dados. Cada propagação direta e inversa envolve a leitura e atualização de uma quantidade massiva de parâmetros. A largura de banda na ordem de TB/s fornecida pela HBM é um fator determinante para reduzir o tempo de treinamento.

Na fase de inferência, com o rápido desenvolvimento de modelos multimodais e agentes de IA, o volume de chamadas de token aumenta rapidamente. O gargalo das aplicações de inferência muitas vezes não está em "quão rápido se calcula", mas em "quão rápido os dados são fornecidos". O limite da largura de banda é a HBM.

Em nível de sistema, a IA opera sobre uma arquitetura de memória hierárquica: a HBM fornece dados para os aceleradores, a DRAM armazena estado em tempo real e memória de diálogo, e SSDs baseados em NAND fornecem armazenamento persistente para conjuntos de dados, embeddings, índices de recuperação, logs e checkpoints. A HBM está na posição mais próxima do núcleo de computação, assumindo as tarefas de fornecimento de dados mais frequentes e urgentes — isso é insubstituível por qualquer outro meio de armazenamento.

Por isso, todos os principais aceleradores de IA usados para treinamento e inferência de IA generativa utilizam HBM. A HBM não é um "acessório opcional" para IA, mas sim um "tanque de oxigênio" que determina o quão rápido a IA pode avançar.

Desequilíbrio entre oferta e demanda: uma escassez estrutural que dura anos

A demanda por HBM é rígida, mas a oferta está "travada".

Do lado da demanda, em 2026, os gastos globais com infraestrutura de IA devem atingir US$ 450 bilhões, com a computação de inferência representando mais de 70% pela primeira vez, impulsionando forte demanda por GPUs, HBM e chips de rede de alta velocidade. Em 2026, o crescimento da demanda por HBM será impulsionado principalmente pela atualização da capacidade de ASICs de IA, com a capacidade de HBM por chip de IA aumentando significativamente de 96 GB/192 GB para 216 GB/288 GB. Embora a plataforma Rubin da NVIDIA mantenha a capacidade de HBM por GPU similar à geração anterior, o maior volume de embarques continua elevando a demanda geral. Os nove maiores provedores de serviços em nuvem do mundo devem ter despesas de capital totais de cerca de US$ 830 bilhões em 2026, um aumento de 79% em relação ao ano anterior.

Do lado da oferta, embora Samsung, SK Hynix e Micron, as três principais fabricantes, tenham direcionado 70% da nova capacidade/capacidade realocável para HBM, o déficit de capacidade de HBM ainda é de 50% a 60%. Até o primeiro trimestre de 2026, toda a capacidade de HBM das três principais fabricantes já estava vendida. De acordo com dados da SemiAnalysis, a oferta de DRAM em 2026 será cerca de 7% inferior à demanda, e a lacuna da HBM será de 6%, aumentando para 9% em 2027.

Mais crucial é a rigidez da oferta. Mesmo que as três principais fabricantes decidam expandir a capacidade agora, devido a restrições físicas como processo TSV, rendimento de empacotamento avançado e ciclo de entrega de equipamentos, a nova capacidade só será liberada no mínimo em 2028-2029. Bancos de investimento internacionais geralmente acreditam que a escassez estrutural de HBM, com demanda superando a oferta, durará pelo menos até 2028. O CEO da NVIDIA, Jensen Huang, declarou explicitamente que a escassez global de HBM "não é uma flutuação de curto prazo, mas um problema estrutural do setor que durará vários anos".

Do lado dos preços, a Samsung Electronics e a SK Hynix já aumentaram os preços de fornecimento da HBM3E em quase 20% para 2026. O preço inicial do contrato da HBM4 de 12 camadas deve ser cerca de 10% superior ao da HBM3E de 12 camadas de 2025.

Cenário de mercado: quem está liderando essa revolução da memória?

O mercado de HBM apresenta uma concentração extremamente alta. Analistas preveem que a participação de mercado da SK Hynix em embarques em 2026 será de cerca de 52%, Samsung Electronics cerca de 39%, Micron cerca de 8%, com participação muito baixa de players chineses. Em termos de receita, a receita de HBM da SK Hynix em 2026 pode chegar a US$ 5,95 bilhões, mantendo-se firmemente em primeiro lugar global.

No primeiro trimestre de 2026, a participação de mercado global de HBM da SK Hynix era de cerca de 51,4%. A TrendForce prevê que sua participação de mercado anual em HBM em 2026 se manterá em torno de 50%; a Counterpoint prevê que sua participação no mercado de HBM4 chegará a 54%.

As margens brutas das três principais fabricantes já ultrapassaram 70% ou até 80%. A distribuição de lucros da HBM tem uma estrutura de "pirâmide" — quanto mais próximo do núcleo tecnológico e dos gargalos, maior a proporção de distribuição.

Ao mesmo tempo, um fenômeno interessante está ocorrendo: a rentabilidade da DRAM de uso geral está superando estruturalmente a da HBM. Até o primeiro trimestre de 2026, a diferença na margem de lucro operacional entre DRAM de uso geral e HBM já havia se ampliado para mais de 15 pontos percentuais. Cálculos de mercado mostram que, em 2026, alocar capacidade para DRAM de uso geral gera mais que o dobro da receita por wafer em comparação com HBM, e quase o triplo do lucro bruto. É por isso que a SK Hynix está considerando realocar alguns recursos para DRAM de uso geral — mas isso apenas confirma que todo o mercado de memória está passando por um boom generalizado.

Perspectiva de investimento: oportunidades no superciclo da HBM

A escassez estrutural e a tendência de alta de preços da HBM fornecem uma lógica industrial clara para os investidores.

As fabricantes de memória são as beneficiárias diretas. A SK Hynix (ações coreanas), Samsung Electronics (ações coreanas) e Micron (ações americanas) aproveitam seu monopólio tecnológico e escassez de capacidade para obter a maior parte dos lucros excedentes da cadeia. Com base na previsão de que o preço médio da DRAM aumentará 62% até 2026, o Morgan Stanley elevou suas previsões de lucro para fabricantes de memória em 56% a 63%.

O upstream da cadeia industrial também se beneficia. A expansão em larga escala das principais fabricantes de memória impulsiona diretamente a demanda por equipamentos semicondutores, como gravadores, depositadores de filmes finos e testadores, e o aquecimento da cadeia está se transmitindo do upstream para o midstream. A demanda por empacotamento avançado da HBM também impulsionou a industrialização de tecnologias de empacotamento 2.5D como CoWoS.

Os fabricantes de chips de IA são os demandantes finais da HBM. Empresas líderes de chips de IA como NVIDIA (ações americanas) e Broadcom (ações americanas) continuam expandindo suas compras de HBM. O Rubin Ultra da NVIDIA terá capacidade de HBM de até 1 TB por GPU.

Negociação de ações Gate: participe do investimento global em memória e IA de forma integrada

Para investidores que desejam participar deste superciclo da memória, as ações Gate oferecem um canal conveniente de entrada no mercado.

Atualmente, as ações Gate já formaram um sistema de serviços de negociação 7×24 horas cobrindo os três principais mercados: EUA, Hong Kong e Coreia do Sul, suportando mais de 10.000 ações e ETFs americanos, mais de 1.500 ações de Hong Kong e mais de 1.000 ações coreanas, totalizando mais de 12.500 ações e ETFs globais. Os ativos abrangem empresas representativas listadas globalmente, como Apple, NVIDIA, Microsoft, Tencent Holdings, Xiaomi, Samsung Electronics e SK Hynix.

Os usuários podem usar uma conta unificada da Gate para investir em ações globais com USDT, com suporte para negociação de ações fracionárias a partir de 0,01 ação, com direitos como distribuição de dividendos. A plataforma também suporta serviços de desdobramento e agrupamento de ações, e já cobre tanto o aplicativo quanto a web.

As ações Gate, além da negociação pré-mercado, em mercado e pós-mercado, também suportam negociação noturna e de finais de semana, rompendo as limitações de horário dos mercados de valores tradicionais. O serviço de transferência entre corretoras também estará disponível em breve, aumentando ainda mais a flexibilidade e a conveniência da gestão de ativos em ações para os usuários.

Forma de negociação: Após depositar fundos na conta unificada da Gate, o usuário pode selecionar a ação desejada no módulo de negociação de ações e comprar/vender usando USDT. A plataforma oferece cotações em tempo real, ferramentas de análise técnica e tipos de ordem (ordem a mercado, ordem limitada, etc.), com fluxo operacional consistente com a experiência de negociação de criptoativos.

Conclusão

A diferença entre HBM e DRAM é essencialmente a divergência entre as duas rotas tecnológicas: "prioridade de largura de banda" versus "prioridade de custo". No contexto da expansão contínua da capacidade de computação de IA, a HBM, por meio do empilhamento 3D e da tecnologia TSV, conseguiu romper o "Memory Wall", tornando-se um componente central insubstituível para o treinamento e a inferência de grandes modelos.

Em 2026, o mercado global de semicondutores ultrapassou US$ 1,51 trilhão, com crescimento de 250% dos chips de memória, e o mercado de HBM cresceu 58% para US$ 54,6 bilhões. O déficit de capacidade chega a 50%-60%, e toda a capacidade das três principais fabricantes está vendida. Isso não é um ciclo comum de flutuação, mas uma mudança estrutural impulsionada pelos gastos de capital de longo prazo em infraestrutura de IA.

Para os investidores, as três cadeias — fabricantes de memória, equipamentos e materiais, e chips de IA — apresentam lógica industrial clara. E as ações Gate, com seu serviço de negociação 7×24 horas para ações dos EUA, Hong Kong e Coreia do Sul, oferecem uma ferramenta flexível e eficiente para investidores globais participarem deste superciclo da memória. No momento atual de medo extremo do mercado (índice de medo 14-16), a divergência entre os fundamentos da indústria e o sentimento do mercado muitas vezes abriga as oportunidades estruturais mais dignas de atenção.

FAQ

P1: Qual é a principal diferença entre HBM e DRAM?

A principal diferença entre HBM e DRAM tradicional está na arquitetura. A DRAM tradicional adota uma arquitetura planar, melhorando o desempenho por meio de avanços no processo de fabricação; a HBM utiliza tecnologia de empilhamento 3D, usando TSV (Through-Silicon Via) para empilhar verticalmente várias pastilhas DRAM, criando caminhos de dados ultra-largos. A HBM3E pode atingir largura de banda de 1,2 TB/s, mais de 10 vezes a do DDR5, mas seu custo é de 3 a 5 vezes o do DDR5 com a mesma capacidade.

P2: Por que os grandes modelos de IA precisam usar HBM?

O treinamento e a inferência de grandes modelos exigem leitura e escrita de alta velocidade de parâmetros massivos. O crescimento da largura de banda da DRAM tradicional fica muito atrás do aumento da capacidade de computação (a capacidade de computação aumentou 60.000 vezes em 20 anos, enquanto a largura de banda aumentou apenas 100 vezes), criando o gargalo do "Memory Wall". A HBM, com sua largura de banda de nível TB/s, pode fornecer dados continuamente para a GPU, evitando que a capacidade de computação fique ociosa. Todos os principais aceleradores de IA usam HBM.

P3: Quais são os principais players do mercado de HBM?

O mercado de HBM é altamente concentrado. A participação de mercado da SK Hynix em embarques em 2026 é de cerca de 52%, Samsung cerca de 39% e Micron cerca de 8%. A SK Hynix lidera em receita, com previsão de US$ 5,95 bilhões em receita de HBM em 2026. Toda a capacidade de HBM das três principais fabricantes para 2026 já está vendida, e alguns clientes já garantiram capacidade até 2028.

P4: Quanto tempo durará a escassez de oferta de HBM?

Bancos de investimento internacionais geralmente acreditam que a escassez de HBM durará pelo menos até 2028. Do lado da demanda, é impulsionada pelos gastos de capital em infraestrutura de IA; do lado da oferta, por restrições físicas como processo TSV, rendimento de empacotamento e ciclo de entrega de equipamentos. Mesmo que a expansão comece agora, a nova capacidade só será liberada a partir de 2028-2029. Jensen Huang chama isso de "um problema estrutural do setor que durará vários anos".

P5: Como investir em ações relacionadas à HBM na plataforma Gate?

As ações Gate suportam negociação 7×24 horas de ações dos EUA, Hong Kong e Coreia do Sul, cobrindo mais de 12.500 ações e ETFs. Os usuários podem usar uma conta unificada para investir com USDT, com mínimo de 0,01 ação. Os ativos relacionados à HBM incluem fabricantes de memória como SK Hynix (Coreia do Sul), Samsung Electronics (Coreia do Sul), Micron (EUA), e fabricantes de chips de IA como NVIDIA (EUA).

BTC-1,00%
ETH0,46%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado