55TB torna-se 28TB? Os rumores e o pânico por trás da redução pela metade da memória Rubin

Escrevendo: Estudo das Tendências

Na madrugada de 4 de junho, a principal instituição independente de pesquisa na indústria de semicondutores, SemiAnalysis, publicou um boletim matinal.

A mensagem central é apenas uma frase: a capacidade de DRAM SOCAMM por rack do Vera Rubin NVL72 da Nvidia pode ter caído de aproximadamente 55TB para cerca de 28TB, contrariando as expectativas anteriores. A maioria dos sistemas Rubin usará módulos SOCAMM de 96GB, e não os 192GB previstos pelo mercado até então.

Após a divulgação, a reação do mercado foi simples e direta: demanda por memória pela metade, impacto negativo para a Micron. MU caiu mais de 10% durante o pregão, após atingir um recorde de 1089 dólares na véspera, despencando para 971 dólares, uma perda de mais de mil milhões de dólares em valor de mercado em um único dia.

O pânico é real, mas a questão é: a direção do pânico está correta?

Vamos fazer as contas claramente

Vera Rubin NVL72 é o próximo sistema de supercomputação AI de ponta da Nvidia. Cada rack contém 72 GPUs Rubin e 36 CPUs Vera. As GPUs usam HBM4, com 288GB cada, totalizando cerca de 20,7TB por rack — essa parte não mudou. O que mudou foi a configuração das CPUs.

Cada CPU Vera possui 8 slots SOCAMM, podendo inserir módulos de diferentes capacidades. As especificações oficiais divulgadas na CES 2026 indicam que "cada CPU Vera suporta até 1,5TB de LPDDR5X", com uma configuração de 8 módulos de 192GB totalmente preenchidos. Assim, 36 CPUs totalizam cerca de 54TB.

SemiAnalysis afirmou nesta vez que a configuração real de produção provavelmente não será totalmente preenchida. A maioria dos sistemas usará módulos de 96GB, resultando em 8×96GB=768GB por CPU, e 36 CPUs totalizando cerca de 28TB.

De 55TB para 28TB, a redução de capacidade é quase pela metade, e o título sensacionalista diz que a "demanda por memória foi cortada pela metade".

Porém, essa conta, o mercado errou um variável crucial.

A falha lógica do pânico

Primeiro, SOCAMM é um design de slots, não uma solda fixa.

Essa é a detalhe técnico mais facilmente negligenciado na história. Diferente do LPDDR4 soldado na placa-mãe do GB300 Blackwell Ultra, a plataforma Vera Rubin usa módulos SOCAMM2 padronizados pelo JEDEC, que são plugáveis, quentes e podem ser atualizados posteriormente. Hoje, com 96GB, amanhã, se o cliente precisar, basta remover e colocar módulos de 192GB ou até 256GB, como trocar memória RAM.

Na CES 2026, a Nvidia destacou esse design: o tempo de montagem do sistema foi reduzido de 2 horas para 5 minutos. Modularidade, facilidade de manutenção e atualização são uma das maiores evoluções arquiteturais do Vera Rubin em relação ao Blackwell.

Reduzir a configuração inicial de fábrica não significa que a demanda permanente desapareceu. É mais uma estratégia de "entrar primeiro e pagar depois".

Segundo, a razão para reduzir a capacidade não é que não precisem mais, mas que "não é suficiente".

Dylan Patel, fundador da SemiAnalysis, comentou no Twitter algo significativo: "Gosto de uma coisa: aqueles que compartilham nosso relatório muitas vezes deixam de fora a maior parte do conteúdo. Isso acontece com frequência."

Nos comentários no Digg sobre essa notícia, também fica claro: 77,8% dos comentários consideram que a disseminação secundária é sensacionalista e fora de contexto.

O que foi omitido? O contexto.

Em 2026, a oferta global de LPDDR5X está extremamente apertada. A Micron, na reunião Wolfe no final de maio, afirmou claramente que a demanda por memória excede significativamente a capacidade de fornecimento, e essa situação deve persistir até após 2026. A capacidade de produção de HBM da Micron para o ano fiscal de 2026 já está esgotada, com preços do DRAM subindo mais de 110% em relação ao ano anterior, e margem bruta atingindo 74%. Samsung e SK Hynix também estão operando em plena capacidade de produção e vendas.

Nesse contexto, o problema da Nvidia não é que os clientes não queiram mais memória, mas que "não conseguem obter chips LPDDR5X suficientes para preencher cada slot".

Reduzir a configuração padrão de SOCAMM por rack é, na essência, uma gestão de cadeia de suprimentos técnica: ao invés de atrasar a entrega do sistema inteiro por falta de memória, é melhor enviar com uma configuração mais baixa e colocar a capacidade de processamento em operação mais rapidamente.

Isso não é sinal de demanda encolhendo, pelo contrário, é um sinal de que a demanda está superando a oferta.

Terceiro, menos memória ≠ menos racks.

O mercado fez uma multiplicação simples: metade da memória por rack → demanda total pela metade. Mas há outro fator: o volume de unidades entregues.

Se o SOCAMM por rack cair de 55TB para 28TB, sob a mesma restrição de fornecimento de LPDDR5X, a Nvidia pode montar mais racks. Antes, uma remessa de memória era suficiente para 100 racks; agora, quase 200.

O consumo total de LPDDR5X não diminui, apenas é redistribuído em mais racks. Para a Nvidia, essa é uma estratégia pragmática para acelerar o lançamento do Rubin no mercado; para os fabricantes de memória, o volume total de pedidos provavelmente não diminui.

Além disso, a elasticidade da demanda por memória no lado da CPU é grande. Nem todos os workloads precisam de 1,5TB de LPDDR5X. Treinamento de grandes modelos realmente consome muita memória, mas muitas tarefas de inferência, especialmente AI agentic e inferência de longo contexto, podem usar KV cache via NVLink-C2C para mover dados entre HBM e LPDDR5X de forma flexível. Para muitos clientes, 768GB de memória na CPU já é suficiente.

Por que, então, a Micron caiu 10%?

Porque o SemiAnalysis é apenas a segunda gota d'água que fez o camelo desabar.

A primeira foi Broadcom. Antes da abertura do mercado de ações dos EUA em 4 de junho, a Broadcom divulgou seu relatório do Q2. Os números não foram ruins: receita de 22,19 bilhões de dólares, aumento de 48% ano a ano, EPS ajustado de 2,44 dólares, acima do esperado. Mas o CEO, Chen Fuyang, não elevou a previsão de receita de chips AI para 100 bilhões de dólares, e o mercado achou que isso era insuficiente. As ações da Broadcom caíram 15%, puxando o setor de semicondutores para baixo.

Naquele dia, a Micron não tinha nenhuma notícia negativa corporativa. TipRanks, Motley Fool, 24/7 Wall St. e outros veículos apontaram que foi uma queda em cadeia, afetando o setor como um todo. Como a Micron é uma peça central na cadeia de memória AI e altamente vinculada ao sentimento de investimento em AI, a orientação da Broadcom fez o mercado reavaliar o crescimento esperado para toda a cadeia de chips AI.

O relatório do SemiAnalysis se espalhou no mesmo dia, dando aos traders que já buscavam motivos para vender uma narrativa perfeita: não é só o sentimento geral de AI que enfraquece, mas também os números específicos de demanda por memória estão encolhendo.

Uma ação avaliada em um trilhão de dólares, que subiu 900% no último ano e atingiu uma máxima histórica na véspera, agora sofre uma correção. Nesse ponto, qualquer notícia negativa funciona como catalisador para realizar lucros. O pânico não precisa estar correto, só precisa de um pretexto.

Interpretação das Tendências

Três conclusões.

Primeiro, o relatório do SemiAnalysis é preciso por si só, mas a interpretação do mercado está equivocada. A configuração padrão de SOCAMM do Rubin NVL72 provavelmente será inferior ao máximo teórico, devido às realidades da cadeia de suprimentos e à elasticidade da demanda dos clientes. Mas "configuração padrão reduzida" e "demanda por memória encolhendo" estão separados por uma arquitetura modular plugável, e por uma indústria cuja demanda supera a oferta.

Segundo, o risco principal da Micron atualmente não é o SOCAMM, mas o HBM4. O SemiAnalysis já reportou em fevereiro que, na plataforma Rubin da Nvidia, a participação da Micron nos pedidos de HBM4 é zero, enquanto a SK Hynix detém 70% e a Samsung 30%. Apesar de a Micron ter anunciado em março a produção e entrega de HBM4, sua fatia de mercado deve ficar em torno de 18%. Por outro lado, a posição da Micron no campo do SOCAMM é muito sólida: foi a primeira a lançar um SOCAMM de 256GB e é parceira principal da Nvidia na implementação do SOCAMM há cinco anos. A redução na configuração de SOCAMM tem impacto muito menor na Micron do que a marginalização do HBM4.

Terceiro, a queda atual é uma realização de lucros após a alta histórica de um trilhão de dólares, amplificada por dois catalisadores independentes. Broadcom trouxe um impacto emocional, o SemiAnalysis forneceu narrativa. A combinação dos dois fez uma ação que subiu 9 vezes em 12 meses recuar 10%. Do ponto de vista de negociação, isso não é "pânico", é uma correção normal.

Dylan Patel acertou ao dizer no Twitter: a maioria que compartilhou seu relatório, de fato, deixou de lado a parte mais importante dele.

A coisa mais perigosa no investimento em semicondutores não é errar na direção, mas acertar no título e errar na fórmula.

MU-2,35%
NVDA-0,63%
AVGO-1,44%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado