Os preços de aluguel de GPU caíram 30% em três semanas, a cadeia de valor de IA está passando da "grande migração" da Nvidia para os chips de memória

Autor: Claude, Deep Tide TechFlow

Deep Tide Guia de leitura: O preço de aluguel do chip B200 da Nvidia caiu de um pico de 6,11 dólares/hora no final de maio para 4,22 dólares/hora, uma queda de cerca de 30% em três semanas. Ao mesmo tempo, o setor de semicondutores apresentou uma diferenciação rara: o ETF de semicondutores SMH subiu 15% no último mês, a Micron e a Sandisk dispararam quase 60%, enquanto a Nvidia caiu 3% no mesmo período. Para quem possui Nvidia ou está considerando investir em infraestrutura de IA, uma questão-chave emergiu: o dinheiro da IA não diminuiu, apenas mudou de lugar.

A Nvidia ainda subiu cerca de 12% este ano, mas a atenção do mercado parece já não estar mais nela.

No último mês, o ETF de semicondutores VanEck (SMH) subiu forte 15%, a Micron e a Sandisk aumentaram quase 60% cada. Nvidia não apenas não acompanhou, mas caiu cerca de 3% contra a tendência. O que mais evidencia o problema é que o principal indicador que sustenta a narrativa de precificação da Nvidia, o preço de aluguel do chip B200 na nuvem, também está enfraquecendo.

De acordo com os dados da plataforma de precificação de poder de GPU Ornn, o preço de aluguel do B200 por hora atingiu 6,11 dólares em 30 de maio, uma máxima de três meses, e desde então vem caindo continuamente, chegando a 4,22 dólares no último fim de semana, uma queda de aproximadamente 30%. O chefe da mesa de negociações One-Delta do Goldman Sachs, Rich Privorotsky, destacou na semana passada: o mito de que a "capacidade de cálculo de IA é escassa" pode estar caindo por terra.

Queda de 30% no preço de aluguel do B200 em três semanas, a narrativa de "escassez de capacidade de cálculo" sofre pressão

O Nvidia B200 é o chip de processamento central para os data centers de grande escala atuais, sendo considerado um termômetro da oferta e demanda de infraestrutura de IA. Segundo dados de várias plataformas de rastreamento de terceiros, os preços do B200 estão se ajustando.

Os dados do Ornn mostram que o preço de aluguel do B200 por hora caiu de 6,11 dólares em 30 de maio para 4,22 dólares no último fim de semana. O índice de preços mensal de 63 provedores de serviços de nuvem compilado pela AIMultiple indica que o preço médio do B200 é de 6,11 dólares/hora, mas novos fornecedores de nuvem (neocloud) já oferecem preços base de 3,44 dólares. Os dados de 26 provedores de nuvem do GetDeploying mostram uma média ainda mais baixa de 4,99 dólares/hora, com ofertas mínimas de apenas 2,25 dólares/hora (contratos de três anos reservados).

Os fatores que impulsionam a queda de preço incluem: melhoria na taxa de rendimento do processo 4NP da TSMC, reduzindo o custo de produção do B200; relaxamento na oferta de HBM3e da SK Hynix e Micron no segundo trimestre de 2026; e mais fornecedores de nuvem adquirindo estoques do B200, como RunPod, Lambda, Nebius, Spheron, que já têm produtos disponíveis, pressionando os preços para baixo.

A pressão deve aumentar na segunda metade do ano. Com a entrada do próximo chip Blackwell Ultra B300 no mercado de estoque imediato, parte da capacidade do B200 poderá passar do modelo sob demanda para o de leilão. O preço de leilão (spot) do B300 já chegou a ofertas de 2,45 dólares/hora, mais barato que o preço mínimo de listagem do B200. Instituições como Spheron e Thunder Compute preveem que o preço sob demanda do B200 pode se estabilizar entre 2,50 e 3,00 dólares no quarto trimestre de 2026.

Para investidores que possuem ações da Nvidia, a fraqueza nos preços de aluguel significa que as margens de lucro dos clientes finais (provedores de nuvem, novas plataformas de nuvem) estão sob pressão, e a disposição de compra desses clientes influencia diretamente o ritmo dos pedidos à Nvidia.

Setor de semicondutores em forte diferenciação: memória dispara, Nvidia fica de fora

Essa rodada de diferenciação é bastante marcante.

A Nvidia subiu cerca de 12% até agora em 2026, mas caiu aproximadamente 3% no último mês. O ETF de semicondutores SMH subiu 84% no ano, com 15% de alta no último mês. A Micron subiu quase 60% no último mês, atingindo uma máxima histórica de cerca de 1.089 dólares, com ganho acumulado superior a 700% no ano e valor de mercado ultrapassando 1,2 trilhão de dólares. A Sandisk também subiu quase 60% no último mês, com alta de mais de 4.400% nos últimos 52 semanas.

O mercado talvez não esteja mais pessimista quanto à IA, mas sim percebendo que o gargalo na cadeia de valor da IA está se deslocando.

A lógica anterior era "escassez de GPU → Nvidia tem poder de precificação → os upstreams lucram mais". Agora, ela mudou para: "a oferta de GPU está se relaxando, mas a demanda por memória de alta largura de banda (HBM) e armazenamento está crescendo exponencialmente, tornando a memória o novo gargalo."

O último relatório trimestral da Micron (segundo trimestre de 2026) mostrou receita de 23,8 bilhões de dólares, quase o dobro do mesmo período do ano anterior (80 milhões de dólares). A Sandisk, após a cisão da Western Digital, reportou receita de 5,95 bilhões de dólares no terceiro trimestre fiscal de 2026, um aumento de 97%.

Dados divulgados pela TrendForce em 16 de junho indicam que os preços de contratos de memória dispararam mais de 100% no primeiro semestre de 2026, e a escassez estrutural deve continuar na segunda metade do ano. O CEO da Apple, Tim Cook, admitiu na semana passada que a Apple não consegue mais absorver o aumento de custos de memória. Quando até a Apple, com seu forte poder de barganha, admite que "não aguenta mais", a capacidade de precificação dos fabricantes de memória fica evidente.

A Micron divulgará amanhã (24 de junho) seus resultados do terceiro trimestre, e espera-se que sejam recordes. Essa divulgação será um teste crucial para determinar se o "superciclo de memória" pode continuar.

Diretor de negociações do Goldman Sachs: indicadores principais são os preços de aluguel

Rich Privorotsky, chefe da mesa de negociações One-Delta do Goldman Sachs, apresentou na semana passada um quadro de avaliação claro:

Se a capacidade de cálculo realmente for escassa, os preços de aluguel devem permanecer firmes, e os investimentos contínuos fazem sentido. Se a oferta aumentar e os preços de aluguel continuarem caindo, a hipótese de "escassez de capacidade de cálculo" que sustenta toda a cadeia de hardware de IA será abalada.

Ele destacou que essa pressão começará pelo hardware. Os verdadeiros beneficiários são as empresas que vendem sistemas completos e monetizam pelo uso, não apenas os fornecedores upstream que vendem "picaretas e pás". O maior risco está nas etapas superiores da infraestrutura, pois seus valores ainda se baseiam na premissa de "escassez contínua".

A mensagem é clara: o modelo de negócio da Nvidia é vender chips (picaretas e pás), não cobrar pelo uso. Se os preços de aluguel dos clientes finais caírem, mas o preço dos chips da Nvidia permanecer inalterado, ocorrerá uma compressão de margens, levando a uma desaceleração nos pedidos.

O relatório recente da Citadel Securities, "Tokenomics", também reforça essa avaliação: as restrições centrais à adoção de IA mudaram de "capacidade do modelo" para "custo e escassez de poder de cálculo", com os usuários migrando rapidamente para modelos mais baratos. O índice de preços dos tokens caiu por sete dias consecutivos, a maior queda desde o início do ano.

A professora de finanças da Universidade de Santa Clara, Seoyoung Kim, explica de forma mais direta: "A maioria dos compradores não sabe quanto poder de cálculo precisará no próximo ano, os fornecedores não sabem quanto GPU devem produzir, e a Nvidia também não sabe quanto deve fabricar. Todos estão adivinhando, e quando as expectativas mudam de 'não é suficiente' para 'talvez seja demais', os preços sofrem pressão."

Contrato de 30 bilhões de dólares entre SpaceX e Google: mercado de contratos de longo prazo ainda está aquecido

Embora os preços de aluguel à vista estejam caindo, o mercado de contratos de longo prazo conta outra história.

Segundo documento enviado pela SpaceX à SEC em 5 de junho, o Google concordou em pagar 920 milhões de dólares por mês de outubro de 2026 a junho de 2029, para alugar cerca de 110 mil GPUs da Nvidia, além de processadores, memória e outros componentes. O valor total do contrato é de aproximadamente 300 bilhões de dólares. Em maio, a Anthropic assinou contrato semelhante com a SpaceX, pagando 1,25 bilhão de dólares por mês para alugar toda a capacidade do seu data center Colossus 1 em Memphis, totalizando quase 45 bilhões de dólares.

O contexto dessas contratações é que, após a fusão com a xAI em fevereiro de 2026, a SpaceX transformou seu supercomputador Colossus, anteriormente de uso próprio, em um ativo comercial de aluguel, visando garantir receitas significativas antes do IPO (estimado em 1,75 trilhão de dólares).

Para a Nvidia, esse é um sinal ambíguo. Por um lado, contratos de longo prazo de 110 mil GPUs demonstram que grandes clientes continuam a garantir capacidade em larga escala, e o RBC Capital Markets afirmou que a Nvidia "está em posição mais favorável entre os pares", acreditando que esses acordos de aluguel de GPU podem pelo menos no curto prazo aliviar preocupações de que ASICs estejam tomando fatia de mercado da Nvidia.

Por outro lado, a necessidade da Google de alugar capacidade do SpaceX decorre justamente do fato de sua própria produção não acompanhar a demanda. Os gastos de capital da Google em 2026 estão entre 180 e 190 bilhões de dólares, enquanto o pagamento mensal de 920 milhões de dólares da SpaceX representa menos de 6% do orçamento anual, sendo uma "capacidade de transição". Quando esses grandes clientes começarem a construir seus próprios data centers em 2027-2028, a demanda por aluguel externo poderá diminuir, levantando dúvidas sobre a manutenção do nível atual.

O contrato também inclui uma cláusula de rescisão com aviso prévio de 90 dias. Isso não parece um contrato assinado em um cenário de "escassez extrema de capacidade", mas sim uma saída para o comprador.

Risco da Nvidia: não na demanda, mas na precificação

Ao juntar todas essas pistas, o problema da Nvidia é que a distribuição de lucros na cadeia de valor da IA está mudando.

Na oferta de GPUs, melhorias na taxa de rendimento da TSMC, mais fornecedores adquirindo estoques e o lançamento em larga escala do B300 estão ajudando a aliviar a escassez extrema de 2024-2025. Do lado da demanda, grandes clientes continuam comprando em grande volume, mas mudaram de "comprar a qualquer custo" para "comparando preços, contratos de longo prazo e opções de saída". Quanto às margens, os preços de aluguel na ponta final já estão caindo; se a Nvidia não conseguir reduzir seus preços de chips na mesma proporção, a margem de lucro será comprimida, o que pode desacelerar os pedidos.

A memória de chips virou uma nova paixão, refletindo a mudança na cadeia de valor.

À medida que os modelos de IA aumentam de tamanho e as tarefas de inferência se multiplicam, a demanda por memória de alta largura de banda (HBM) se torna mais rígida. Os GPUs podem melhorar sua eficiência por meio de atualizações arquitetônicas (como a precisão FP4 do B200, que reduz pela metade o uso de bytes por parâmetro), mas a largura de banda da memória é uma limitação física, sem atalhos. A capacidade de HBM da Micron já está esgotada para 2026, uma condição de "dinheiro não compra" que contrasta com a queda no preço de aluguel do B200.

O relatório financeiro de amanhã da Micron fornecerá um próximo dado-chave. Se a receita e as projeções superarem as expectativas, a narrativa de "transferência de valor da GPU para memória" será reforçada. Para os investidores, isso não significa uma visão pessimista da IA, mas sim uma necessidade de repensar quem na cadeia está ganhando mais e quem está perdendo espaço.

SMH1,10%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado