55TB torna-se 28TB? Os rumores e o pânico por trás da redução pela metade da memória Rubin

Question

Escrevendo: Estudo das TendênciasNa madrugada de 4 de junho, a principal instituição independente de pesquisa na indústria de semicondutores, SemiAnalysis, publicou um boletim matinal.A mensagem central é apenas uma frase: a capacidade de DRAM SOCAMM por rack do Vera Rubin NVL72 da Nvidia pode ter caído de aproximadamente 55TB para cerca de 28TB, contrariando as expectativas anteriores. A maioria dos sistemas Rubin usará módulos SOCAMM de 96GB, e não os 192GB previstos pelo mercado até então.Após a divulgação, a reação do mercado foi simples e direta: demanda por memória pela metade, impacto negativo para a Micron. MU caiu mais de 10% durante o pregão, após atingir um recorde de 1089 dólares na véspera, despencando para 971 dólares, uma perda de mais de mil milhões de dólares em valor de mercado em um único dia.O pânico é real, mas a questão é: a direção do pânico está correta?Vamos fazer as contas claramenteVera Rubin NVL72 é o próximo sistema de supercomputação AI de ponta da Nvidia. Cada rack contém 72 GPUs Rubin e 36 CPUs Vera. As GPUs usam HBM4, com 288GB cada, totalizando cerca de 20,7TB por rack — essa parte não mudou. O que mudou foi a configuração das CPUs.Cada CPU Vera possui 8 slots SOCAMM, podendo inserir módulos de diferentes capacidades. As especificações oficiais divulgadas na CES 2026 indicam que "cada CPU Vera suporta até 1,5TB de LPDDR5X", com uma configuração de 8 módulos de 192GB totalmente preenchidos. Assim, 36 CPUs totalizam cerca de 54TB.SemiAnalysis afirmou nesta vez que a configuração real de produção provavelmente não será totalmente preenchida. A maioria dos sistemas usará módulos de 96GB, resultando em 8×96GB=768GB por CPU, e 36 CPUs totalizando cerca de 28TB.De 55TB para 28TB, a redução de capacidade é quase pela metade, e o título sensacionalista diz que a "demanda por memória foi cortada pela metade".Porém, essa conta, o mercado errou um variável crucial.A falha lógica do pânicoPrimeiro, SOCAMM é um design de slots, não uma solda fixa.Essa é a detalhe técnico mais facilmente negligenciado na história. Diferente do LPDDR4 soldado na placa-mãe do GB300 Blackwell Ultra, a plataforma Vera Rubin usa módulos SOCAMM2 padronizados pelo JEDEC, que são plugáveis, quentes e podem ser atualizados posteriormente. Hoje, com 96GB, amanhã, se o cliente precisar, basta remover e colocar módulos de 192GB ou até 256GB, como trocar memória RAM.Na CES 2026, a Nvidia destacou esse design: o tempo de montagem do sistema foi reduzido de 2 horas para 5 minutos. Modularidade, facilidade de manutenção e atualização são uma das maiores evoluções arquiteturais do Vera Rubin em relação ao Blackwell.Reduzir a configuração inicial de fábrica não significa que a demanda permanente desapareceu. É mais uma estratégia de "entrar primeiro e pagar depois".Segundo, a razão para reduzir a capacidade não é que não precisem mais, mas que "não é suficiente".Dylan Patel, fundador da SemiAnalysis, comentou no Twitter algo significativo: "Gosto de uma coisa: aqueles que compartilham nosso relatório muitas vezes deixam de fora a maior parte do conteúdo. Isso acontece com frequência."Nos comentários no Digg sobre essa notícia, também fica claro: 77,8% dos comentários consideram que a disseminação secundária é sensacionalista e fora de contexto.O que foi omitido? O contexto.Em 2026, a oferta global de LPDDR5X está extremamente apertada. A Micron, na reunião Wolfe no final de maio, afirmou claramente que a demanda por memória excede significativamente a capacidade de fornecimento, e essa situação deve persistir até após 2026. A capacidade de produção de HBM da Micron para o ano fiscal de 2026 já está esgotada, com preços do DRAM subindo mais de 110% em relação ao ano anterior, e margem bruta atingindo 74%. Samsung e SK Hynix também estão operando em plena capacidade de produção e vendas.Nesse contexto, o problema da Nvidia não é que os clientes não queiram mais memória, mas que "não conseguem obter chips LPDDR5X suficientes para preencher cada slot".Reduzir a configuração padrão de SOCAMM por rack é, na essência, uma gestão de cadeia de suprimentos técnica: ao invés de atrasar a entrega do sistema inteiro por falta de memória, é melhor enviar com uma configuração mais baixa e colocar a capacidade de processamento em operação mais rapidamente.Isso não é sinal de demanda encolhendo, pelo contrário, é um sinal de que a demanda está superando a oferta.Terceiro, menos memória ≠ menos racks.O mercado fez uma multiplicação simples: metade da memória por rack → demanda total pela metade. Mas há outro fator: o volume de unidades entregues.Se o SOCAMM por rack cair de 55TB para 28TB, sob a mesma restrição de fornecimento de LPDDR5X, a Nvidia pode montar mais racks. Antes, uma remessa de memória era suficiente para 100 racks; agora, quase 200.O consumo total de LPDDR5X não diminui, apenas é redistribuído em mais racks. Para a Nvidia, essa é uma estratégia pragmática para acelerar o lançamento do Rubin no mercado; para os fabricantes de memória, o volume total de pedidos provavelmente não diminui.Além disso, a elasticidade da demanda por memória no lado da CPU é grande. Nem todos os workloads precisam de 1,5TB de LPDDR5X. Treinamento de grandes modelos realmente consome muita memória, mas muitas tarefas de inferência, especialmente AI agentic e inferência de longo contexto, podem usar KV cache via NVLink-C2C para mover dados entre HBM e LPDDR5X de forma flexível. Para muitos clientes, 768GB de memória na CPU já é suficiente.Por que, então, a Micron caiu 10%?Porque o SemiAnalysis é apenas a segunda gota d'água que fez o camelo desabar.A primeira foi Broadcom. Antes da abertura do mercado de ações dos EUA em 4 de junho, a Broadcom divulgou seu relatório do Q2. Os números não foram ruins: receita de 22,19 bilhões de dólares, aumento de 48% ano a ano, EPS ajustado de 2,44 dólares, acima do esperado. Mas o CEO, Chen Fuyang, não elevou a previsão de receita de chips AI para 100 bilhões de dólares, e o mercado achou que isso era insuficiente. As ações da Broadcom caíram 15%, puxando o setor de semicondutores para baixo.Naquele dia, a Micron não tinha nenhuma notícia negativa corporativa. TipRanks, Motley Fool, 24/7 Wall St. e outros veículos apontaram que foi uma queda em cadeia, afetando o setor como um todo. Como a Micron é uma peça central na cadeia de memória AI e altamente vinculada ao sentimento de investimento em AI, a orientação da Broadcom fez o mercado reavaliar o crescimento esperado para toda a cadeia de chips AI.O relatório do SemiAnalysis se espalhou no mesmo dia, dando aos traders que já buscavam motivos para vender uma narrativa perfeita: não é só o sentimento geral de AI que enfraquece, mas também os números específicos de demanda por memória estão encolhendo.Uma ação avaliada em um trilhão de dólares, que subiu 900% no último ano e atingiu uma máxima histórica na véspera, agora sofre uma correção. Nesse ponto, qualquer notícia negativa funciona como catalisador para realizar lucros. O pânico não precisa estar correto, só precisa de um pretexto.Interpretação das TendênciasTrês conclusões.Primeiro, o relatório do SemiAnalysis é preciso por si só, mas a interpretação do mercado está equivocada. A configuração padrão de SOCAMM do Rubin NVL72 provavelmente será inferior ao máximo teórico, devido às realidades da cadeia de suprimentos e à elasticidade da demanda dos clientes. Mas "configuração padrão reduzida" e "demanda por memória encolhendo" estão separados por uma arquitetura modular plugável, e por uma indústria cuja demanda supera a oferta.Segundo, o risco principal da Micron atualmente não é o SOCAMM, mas o HBM4. O SemiAnalysis já reportou em fevereiro que, na plataforma Rubin da Nvidia, a participação da Micron nos pedidos de HBM4 é zero, enquanto a SK Hynix detém 70% e a Samsung 30%. Apesar de a Micron ter anunciado em março a produção e entrega de HBM4, sua fatia de mercado deve ficar em torno de 18%. Por outro lado, a posição da Micron no campo do SOCAMM é muito sólida: foi a primeira a lançar um SOCAMM de 256GB e é parceira principal da Nvidia na implementação do SOCAMM há cinco anos. A redução na configuração de SOCAMM tem impacto muito menor na Micron do que a marginalização do HBM4.Terceiro, a queda atual é uma realização de lucros após a alta histórica de um trilhão de dólares, amplificada por dois catalisadores independentes. Broadcom trouxe um impacto emocional, o SemiAnalysis forneceu narrativa. A combinação dos dois fez uma ação que subiu 9 vezes em 12 meses recuar 10%. Do ponto de vista de negociação, isso não é "pânico", é uma correção normal.Dylan Patel acertou ao dizer no Twitter: a maioria que compartilhou seu relatório, de fato, deixou de lado a parte mais importante dele.A coisa mais perigosa no investimento em semicondutores não é errar na direção, mas acertar no título e errar na fórmula.

55TB torna-se 28TB? Os rumores e o pânico por trás da redução pela metade da memória Rubin

Tópicos em destaque

ShareYourUSStocksWinNvidia

PredictNBAChampionWin20000U

IsraelStrikesIranBTCPlunges

BitcoinETFSees7272BTCOutflow

SpaceXRoadshowHighlightsAsteroidMining

Fixado