Por que os preços das GPUs estão fora de controlo?

Question

Título original: A Grande Escassez de GPUs – Capacidade de Aluguer – Lançar o nosso Índice do Preço de Aluguer de 1 Ano do H100
Autores originais: Daniel Nishball、Jordan Nanos、Cheang Kang Wen 等编译：Peggy，BlockBeats

Autores originais: 律动BlockBeats

Fonte original:

Republicação: 火星财经

Nota do editor: À medida que a IA passa de “ferramenta” para base de infraestrutura de “fluxos de trabalho”, os preços de aluguer de GPUs entram numa fase de subida acelerada, com o fornecimento a continuar a apertar.

Desde a subida de quase 40% no preço de um ano do H100, à computação a ser fixada antecipadamente até ao segundo semestre de 2026, e depois à forma como laboratórios de IA continuam a bloquear fornecimento através de contratos de longo prazo e mecanismos de renovação, a lógica de funcionamento do mercado de GPUs mudou de forma bastante clara: o preço deixa de ser determinado principalmente pelos custos do hardware, passando a ser moldado em conjunto pelo consumo de tokens, pelas capacidades do modelo e pela eficiência de produção.

A mudança do lado da procura é particularmente crucial. Novos paradigmas como sistemas multiagente, geração nativa de conteúdo e ferramentas de programação em IA estão a empurrar o uso de tokens para uma trajetória de crescimento em ritmo acelerado. A conclusão central do relatório também se vai tornando gradualmente mais clara: a relação investimento-produto das ferramentas de IA já foi validada, com retornos de 5–10 vezes, o que torna difícil que os preços de computação formem uma restrição eficaz sobre a procura durante um período relativamente longo.

A tensão gerada por isto torna-se cada vez mais evidente: o mercado real de capacidade de computação apresenta uma escassez generalizada e o poder de definição de preços a subir, enquanto o mercado de capitais continua preso às expectativas de “que acabará por ficar em excesso e ser mercantilizado”. Este desfasamento entre expectativa e realidade está a remodelar a lógica de avaliação do setor de infraestrutura de IA.

Quando a capacidade de computação se torna um novo bem de produção, o seu mecanismo de preços, a estrutura de fornecimento e o retorno do capital estão a passar por uma profunda reestruturação.

A seguir, o texto original:

A procura por Claude 4.6 Opus da Anthropic e por Claude Code disparou de forma acentuada. As receitas recorrentes anuais (ARR) num único trimestre saltaram, desde o final do ano passado, de 9 mil milhões de dólares para mais de 25 mil milhões de dólares, quase triplicando. Ao mesmo tempo, os modelos open source, representados por GLM e Kimi K2.5, também estão a impulsionar a rápida expansão de casos de uso associados a modelos open source. Empresas como a Anthropic, a OpenAI e várias Neolabs continuam a captar financiamento, o que igualmente intensifica a necessidade por recursos de GPU.

Este ponto de viragem implica que a procura aumentou drasticamente num curto espaço de tempo, e que já surgiu uma onda de “race” para comprar GPUs por parte de hyperscalers e de novos fornecedores de serviços de cloud (Neoclouds).

Esta nova procura está a empurrar os preços ao longo de toda a cadeia de fornecimento, desde a DRAM e o armazenamento NAND, até cabos de fibra ótica, alojamento em datacenters e até turbinas a gás, com praticamente todos os produtos e serviços relacionados a registar subidas.

Os preços de aluguer de GPUs tornaram-se no mais recente segmento entre muitos produtos e serviços ligados a capacidade de computação em que se manifesta escassez de fornecimento e uma subida acentuada de preços. O preço dos contratos de aluguer de GPU H100 de um ano passou do mínimo de 1,70 dólares por GPU por hora em outubro de 2025, para 2,35 dólares em março de 2026; a subida foi de quase 40%.

A capacidade de aluguer de GPU sob demanda (on-demand) esgotou praticamente em todos os modelos—para utilizadores que já bloquearam instâncias sob demanda, mesmo depois de os preços subirem, não estão dispostos a devolver a capacidade ao mercado. No início de 2026, a dificuldade em procurar capacidade de GPU era quase como tentar comprar bilhetes para “o último voo”: preços elevados, quase sem bilhetes disponíveis. Com uma analogia mais apropriada: mais do que “comprar bilhetes”, parece “procurar um canal para comprar medicamentos”.

Na SemiAnalysis, acompanhamos há muito tempo, de forma profunda e contínua, várias tendências e tópicos-chave no ecossistema Neocloud e dos hyperscalers; isso inclui os preços de aluguer de GPUs. Esta capacidade vem do nosso trabalho de pesquisa e prática contínuos em projetos como ClusterMAX, InferenceX e AI cloud TCO (custo total de posse).

Entretanto, também dedicámos bastante esforço para ajudar vários laboratórios de IA a fazer a ligação com fornecedores Neocloud, procurando no mercado recursos de aluguer de GPUs, e mantendo conversas contínuas com quase todos os participantes do ecossistema sobre as tendências de variação dos preços do aluguer de GPUs.

Desde 2023, construímos e mantivemos um conjunto de índices de preços de aluguer de GPUs para clientes, cobrindo modelos de GPU principais (como H100, H200, B200, B300, GB200, GB300, MI300, MI325, MI355) e diferentes prazos de aluguer—desde sob demanda (on-demand), aluguer curto de 48kês, até contratos de longo prazo de no máximo 5 anos. Este índice é construído com base em dados de inquéritos a vários fornecedores Neocloud e compradores de capacidade de computação, e é validado cruzando dados de transações reais, bem como os resultados de negociações e fechos de negócios em que participámos.

Hoje, disponibilizamos ao público o índice de preços de aluguer de GPU H100 de um ano, com o objetivo de fornecer mais dados e perceções para a indústria. O índice é atualizado mensalmente, e continuaremos a publicar análises de tendências mais recentes e observações de mercado através de X e LinkedIn. Quanto a dados completos de preços que cobrem diferentes estruturas de prazos e outros modelos principais de GPU, de momento apenas estão disponíveis para utilizadores institucionais que subscrevem o nosso modelo de AI cloud TCO.

Este relatório abordará as mais recentes tendências do mercado de aluguer de GPUs, as observações na linha da frente e os dados-chave, analisando como interpretamos a estrutura global do mercado e fornecendo uma avaliação inicial sobre a direção futura dos preços de aluguer.

O mercado de aluguer de GPUs entrou numa fase de “pricing dinâmico”

Apenas olhando para a curva de preços do aluguer de um ano do H100, ainda não é suficiente para retratar completamente o nível de aperto do mercado—o que é refletido pela nossa experiência real na obtenção de capacidade de computação na linha da frente, e pelo feedback dos participantes do mercado, é ainda mais severo.

A procura atual vem de múltiplos cenários de utilização altamente heterogéneos; quase não existe “uma solução universal”. Por exemplo, no lado da inferência, modelos grandes de especialistas mistos (MoE) são mais adequados para rodar em sistemas de grande escala recentes como GB300 NVL72; já no lado do treino, o H100 continua a ter vantagens em custo-benefício, de modo que mesmo GPUs da “geração anterior” relativamente antiga mantêm a procura em níveis elevados.

Os clientes estão atualmente até a competir para pagar o preço dos instances spot da AWS p6-b200, a 14 dólares por GPU por hora; alguns fornecedores Neocloud de topo já deixaram de vender nós individuais; certos preços de renovação de H100 são, na verdade, exatamente os mesmos de quando os contratos foram assinados há dois ou três anos; e há ainda alguns contratos de H100 que foram renovados diretamente até 2028, com duração de quatro anos. Agora, procurar sequer um cluster H100 ou H200 com apenas 8 nós (64 GPUs) não é fácil—entre os fornecedores que contactámos, metade já estava completamente esgotada; e a maioria das respostas dos fornecedores foi: “não existe qualquer GPU com arquitetura Hopper que vença e seja libertada em breve por contratos”.

Chegámos até a ouvir dizer que alguns arrendatários de capacidade de computação começaram a desmontar os seus próprios clusters arrendados para voltar a subarrendar, quase como desmontar apartamentos para alugueres de curta duração durante a corrida de automóveis em Mónaco. A seguir, será que vai surgir o chamado “Neocloud segundo proprietário”? Provavelmente já não é apenas uma piada.

A oferta da Blackwell também está extremamente apertada. A nossa compreensão é que, devido à forte procura por modelos open source de weights e ao contínuo rebentar de procura por inferência, o ciclo de implementação e entrega do novo lote de clusters Blackwell foi alargado para junho a julho. Além disso, muitos dos clusters que estão para entrar em produção também já foram bloqueados antecipadamente. Na prática, olhando para todo o mercado, a capacidade que entrará até agosto a setembro de 2026 já está quase toda reservada.

Preços do aluguer de GPUs: “voltar a subir”

Mas por que razão o mercado chegou a este ponto? Apenas há 6 meses, a maioria dos observadores do mercado ainda tinha dúvidas sobre o “valor final” (terminal value) das GPUs e considerava, de forma geral, que os preços do aluguer de GPUs acabariam inevitavelmente por continuar a cair com o tempo. Naquela altura, se uma Neocloud ou um hyperscaler adotasse um ciclo de depreciação de 6 anos nos seus modelos financeiros para tratar ativos de capacidade de computação de GPUs, ainda assim poderia até ser criticado por analistas financeiros. Antes de discutir tendências futuras, vejamos rapidamente como a situação evoluiu até aqui.

Antes da segunda metade de 2025, a expectativa dominante no ecossistema era: com a implementação em grande escala da Blackwell e com o seu custo de computação por unidade significativamente mais baixo, os preços de aluguer da Hopper (ou seja, H100 e H200) iriam recuar de forma clara. Mas a realidade foi precisamente o contrário. Em meados do segundo semestre de 2025, a procura por H100 não enfraqueceu; pelo contrário, em muitos cenários até se intensificou. A rápida adoção de modelos open source de weights e a aceleração contínua da procura de inferência foram os primeiros sinais desta vaga de procura de capacidade de computação quase interminável.

Em janeiro de 2026, o mercado de capacidade de computação atingiu o próximo ponto de viragem: após vários trimestres de subida rápida nos preços de DRAM e NAND, entrou numa fase de disparada quase “parabólica”. De acordo com os nossos modelos de armazenamento, no primeiro trimestre de 2026, a taxa de crescimento ano contra ano dos preços dos contratos de LPDDR5 e DDR5 chegou a aproximar-se de cerca de 4 vezes e 5 vezes, respetivamente.

Para lidar com o risco de margens provocado pelo aumento acentuado dos custos de componentes, os fabricantes OEM começaram a aumentar os preços dos servidores de IA, e a magnitude da subida de preços foi claramente superior à dos aumentos dos preços dos próprios componentes de base. Isto tornou a tomada de decisão de CAPEX de clusters mais complexa: custos mais elevados de aquisição de servidores comprimiram o retorno esperado dos projetos, levando alguns operadores a abrandar o ritmo de implementação e, em alguns casos, a abandonar diretamente os projetos. Como resultado, parte da nova oferta que poderia ter entrado foi adiada ou suspensa, agravando ainda mais a tensão no mercado de aluguer.

Nesta confusão de compras desencadeada pelo “descontrole dos preços dos servidores de IA”, a procura por aluguer de GPUs cresceu de forma significativa. No mercado, quase a capacidade remanescente foi totalmente consumida em janeiro e fevereiro. Em março, seja para H100, H200 ou B200, quase já não se encontrava capacidade disponível em nenhum prazo de aluguer. No fim de janeiro, o preço de aluguer de um ano já ultrapassou 2 dólares por GPU por hora; e na segunda metade de fevereiro, em relação ao fim de janeiro, voltou a subir mais 15%–20%. Prevê-se que até ao fim de março ainda suba mais 15%–20% em termos sequenciais (mês contra mês).

Um dos principais impulsionadores da procura no início deste ano veio da geração nativa de conteúdo (native media generation). Aplicações como Seedance e Nano Banana estão a levar os utilizadores a gerar e iterar imagens e vídeos em escala, aumentando de forma significativa o throughput de tokens. Mas mais importante—e mais visível—é a ascensão de cargas de trabalho multiagente (multi-agent): estes sistemas executam fluxos de vários passos e iteram continuamente em ambientes de alta concorrência, o que leva a um crescimento “exponencial” no consumo de tokens e na procura por computação.

Esta tendência é particularmente evidente nos dados relacionados com Claude Code; já o mencionámos em vários artigos anteriores. Por exemplo, na SemiAnalysis, apenas nos últimos 7 dias, a empresa consumiu dezenas de milhares de milhões de tokens, com um custo médio de cerca de 5 dólares por milhão de tokens. No entanto, a poupança de tempo, a expansão de fluxos de trabalho e o aumento de capacidade daí resultantes superam em larga medida o custo em si. Atualmente, a SemiAnalysis incorporou uma gama completa de ferramentas de IA em múltiplos fluxos de trabalho; já não se limita à pesquisa simples e à sumarização, indo além para painéis de dados, captura automatizada, processamento massivo de dados e até modelação financeira baseada em agentes.

Também acompanhamos o crescimento explosivo desta procura com métricas como Claude Commits Daily (submissões diárias de Claude). De acordo com a tendência atual, prevemos que até ao final de 2026 o Claude Code represente mais de 20% de todas as submissões de código. Pode dizer-se que, no tempo em que ainda não tinha reparado, a IA já começou a “devorar” todo o processo de desenvolvimento de software. Para clientes institucionais que pretendam obter este conjunto de dados, podem contactar a nossa equipa de API. Antecipando um pouco: este volume de submissões já está claramente acima do nível em que estava quando lançámos originalmente.

No nosso meio, quase toda a gente é utilizadora pesada do Claude Code. Mas também sabemos que este meio, por si só, é profundamente imerso nos domínios de IA e semicondutores—em essência, é apenas “um pequeno grupo na linha da frente”.

Para muitas empresas da lista Fortune 500 e para o público em geral, o Claude Code e o “mundo dos agentes” são apenas um tema marginal um pouco inusual, que aparece ocasionalmente no feed de Facebook ou em podcasts da NPR. Quase ainda não lhes ocorreu que uma onda de produtividade impulsionada por agentes, juntamente com choques estruturais, está a chegar.

À medida que mais participantes da economia real vão ganhando consciência do incrível retorno sobre investimento proporcionado pela utilização de ferramentas de IA e se vão juntando a esta “vaga de capacidade de computação”, o consumo de tokens continuará a subir em degraus. Quanto ao debate sobre a relação investimento-produto na IA, na verdade já ficou assente—o valor criado ao usar ferramentas de IA pode frequentemente atingir uma ordem de grandeza acima dos seus custos. Neste contexto, a procura por tokens a deslocar-se continuamente para a direita (a aumentar) está a formar uma força forte e (nesta fase) relativamente pouco elástica, empurrando os preços de aluguer de GPUs continuamente para cima.

Em termos simples: se o retorno do investimento em ferramentas de IA for de 5–10 vezes, então ainda há um potencial de subida considerável nos preços do aluguer de GPUs para que só aí se possa efetivamente restringir a procura. Também não excluímos que uma nova subida dos preços de aluguer continue a transmitir-se para cima, elevando os custos dos servidores e de componentes essenciais.

Publicação do índice de preços de aluguer de 1 ano do SemiAnalysis H100

Hoje, disponibilizamos gratuitamente ao público o índice de preços dos contratos de aluguer de 1 ano do H100 da SemiAnalysis, com o objetivo de aumentar o conhecimento do mercado sobre as tendências dos preços de aluguer de GPUs e a transparência.

O índice é construído com base em dados de inquéritos mensais a mais de 100 participantes do mercado (incluindo fornecedores Neocloud, compradores e vendedores de capacidade de computação), para determinar o intervalo representativo de preços de aluguer de GPUs (percentis 25 a 75). Em simultâneo, validamos cruzando com dados de transações reais e, na nossa própria rede, fazemos matchmaking entre compradores e vendedores, participando diretamente em parte das transações, para calibrar ainda melhor o nível de preços.

Desde 2023, acompanhamos continuamente GPUs, incluindo H100, H200, B200, B300, GB200 e GB300, em preços de contratos com prazos de 3 meses até 5 anos; ao mesmo tempo, incorporamos também dados relacionados com a série AMD (MI300, MI325, MI355).

Comparado com os índices de GPU já existentes no mercado, o índice de contratos de 1 ano do H100 da SemiAnalysis tem algumas diferenças-chave:

Em primeiro lugar, muitos índices de aluguer de GPUs baseiam-se em cotações spot/on-demand ou em preços de listagem públicos; mas na prática, a esmagadora maioria das transações de aluguer de GPUs é concluída através de contratos de longo prazo, tipicamente com duração superior a 6 meses. Estes preços tendem a ser formados por negociações bilaterais e não aparecem em qualquer base de dados pública. A maioria dos grandes fornecedores Neocloud prefere assinar contratos de pelo menos 1 ano; 2–3 anos são ainda mais desejáveis; e é ainda melhor se se conseguir um acordo de “bulk” de 5 anos. O índice de aluguer de 1 ano do H100 da SemiAnalysis foca-se precisamente neste “mercado de contratos”—isto é, no segmento em que existe mais volume real de transações. Ao apontar explicitamente para um prazo específico, o índice torna-se também mais fácil de o utilizador compreender o intervalo de mercado que cobre e compará-lo com as suas próprias observações para validação cruzada.

Em segundo lugar, os preços divulgados publicamente não representam os preços reais concretizados. Os preços publicados por hyperscalers e Neoclouds fornecem mais uma referência sobre direções de tendência do que o nível real de transações. Esses preços frequentemente ficam para trás em relação às mudanças do mercado de contratos, sendo normalmente ajustados apenas depois de a procura por capacidade de computação já ter mudado. Sobretudo no mercado on-demand, os preços são frequentemente definidos num nível relativamente fixo; já as mudanças reais de oferta e procura aparecem através de utilização ou taxa de ocupação de recursos, com ajustes incertos feitos apenas quando necessário. Este mecanismo de mercado será aprofundado mais à frente no artigo.

Em terceiro lugar, embora exista no mercado uma série de índices que lidam com grandes volumes de cotações, preços e dados de transação e tenham vantagens na análise de tendências, a nossa abordagem dá mais ênfase à interação direta com participantes do mercado. Por trás de cada cotação e de cada transação há um contexto específico e uma lógica de decisão. Queremos, ao mesmo tempo em que apresentamos dados quantitativos, complementar com estas informações qualitativas e observações na linha da frente, de modo a reproduzir de forma mais completa a estrutura real do mercado de aluguer de GPUs.

Para utilizadores institucionais com subscrição, também disponibilizamos dados de estrutura de prazos completos que cobrem quase todos os principais mercados de aluguer de GPUs.

No lançamento do índice de preços de contratos de 1 ano do H100, disponibilizámos também, para utilizadores subscritores do modelo SemiAnalysis Tokenomics em nível institucional, o SemiAnalysis Tokenomics Dashboard, utilizado para acompanhar e compreender a configuração de modelos de IA de ponta. Este painel permite aos utilizadores personalizar e comparar em múltiplas dimensões, como código, avaliação de inferência, matemática e agentes; comparar a precificação das APIs de diferentes modelos e fornecedores; e visualizar dados-chave divulgados pelos principais laboratórios de IA, incluindo consumo de tokens, receitas, avaliação e dimensão de clientes.

A estrutura atual do mercado de aluguer de GPUs

Antes da segunda metade de 2025, o ambiente de preços do mercado de aluguer de GPUs era relativamente mais competitivo. Na altura, os operadores tinham mais stocks de GPUs disponíveis, enquanto a procura final só começava agora a acelerar. Assim, a concorrência entre fornecedores Neocloud era intensa, e em geral disputavam clientes através de preços mais atrativos. O objetivo central era aumentar a taxa de utilização, “espremer” ao máximo o valor dos ativos de computação existentes antes de chegar o próximo ciclo de iteração das GPUs.

Mas desde então, o panorama do mercado virou 180 graus. Atualmente, a Neocloud e os hyperscalers já controlam totalmente a iniciativa—podem exigir adiantamentos mais elevados, melhores condições de preços, prazos de contrato mais longos e até escolher autonomamente o momento de início e fim do contrato, para se ajustarem aos seus próprios planos de stock e capacidade produtiva. Ao mesmo tempo, o tempo também está do lado do lado da oferta: podem avançar com a implementação no ritmo que lhes convém e, num ambiente de preços em contínuo aumento, filtrar gradualmente a combinação de clientes mais valiosa.

Estruturalmente, o mercado de aluguer de GPUs pode ser dividido, de forma aproximada, em três grandes segmentos, correspondendo a diferentes tipos de necessidades dos clientes:

Aluguer de curto prazo: sob demanda (on-demand), spot e contratos com menos de 3 meses

Contratos de médio prazo: contratos de 3 meses a 3 anos ou mais

Longo prazo com “offtake”: contratos de 4–5 anos, sendo 5 anos o mais comum

Aluguer de curto prazo: sob demanda, spot e contratos com menos de 3 meses

O aluguer de curto prazo está na parte mais frontal de toda a estrutura de prazos; em muitos casos corresponde a “capacidade remanescente”. No entanto, há também alguns fornecedores (como Runpod e Lambda) que se especializam em fornecer capacidade sob demanda ou spot de escala considerável e com flexibilidade.

Note-se que o mecanismo de preços do mercado on-demand é significativamente diferente do dos outros mercados de contratos. Em geral, os fornecedores definem para recursos on-demand um nível de preço relativamente fixo e, apenas em casos muito raros, ajustam-no. Por outras palavras, os preços do mercado de curto prazo não são totalmente impulsionados pela oferta e procura em tempo real; refletem sobretudo a tensão do mercado através das alterações na utilização de recursos.

Os fornecedores normalmente fazem um ajuste pontual de preços com base na taxa de utilização: quando a utilização é baixa, reduzem preços para estimular a procura; quando a utilização se aproxima de lotação máxima, aumentam preços, porque mesmo com níveis de preço mais elevados a procura ainda consegue manter-se alta.

Isto também explica por que razão, numa perspetiva de séries temporais, os preços on-demand divulgados pela Neocloud tendem a permanecer inalterados durante um longo período e depois subirem ou descerem de forma “em degraus”. Para o mercado on-demand, o que realmente reflete mudanças de procura em alta frequência não é o preço, mas sim a taxa de utilização dos recursos.

Contratos de médio prazo (Mid-Term Contracts)

Em termos económicos, o mais importante é o “mercado de contratos”, porque o valor de transações de aluguer de GPUs da grande maioria ocorre neste segmento. Em particular, os contratos de 1 ano são especialmente importantes: por um lado, refletem a procura marginal de clientes que não são laboratórios de IA; por outro, mostram a procura por transbordo (spillover) proveniente de clientes de grande dimensão, sendo o indicador mais sensível para avaliar o nível de aperto do mercado.

As empresas “AI Natives” e laboratórios de IA pequenos e médios tendem a operar principalmente no intervalo de 1–3 anos. No entanto, uma tendência recente é clara: essas instituições também começaram a tentar bloquear capacidade de computação com contratos mais longos—muitos já se estendem para 4 anos ou mais, e algumas até estão dispostas a pagar mais de 20% de pré-pagamento, o que não era comum em contratos com duração superior a 4 anos no passado.

Longo prazo com “offtake” (Long-Term Offtakes)

No mercado de prazos mais longos de 4–5 anos, a força dominante são grandes laboratórios de IA, que bloqueiam grandes volumes de capacidade de computação desde cedo. Estas transações tipicamente correspondem a clusters de escala de 50MW, 100MW e até mais, o que equivale aproximadamente a 24 mil a 48 mil GPUs GB300 NVL72. No conjunto, estes acordos de longo prazo com “offtake” já ocupam uma parcela substancial do mercado de aluguer de GPUs da Neocloud.

Os laboratórios de IA preferem este tipo de contratos porque conseguem bloquear, de uma só vez, grandes volumes de capacidade de computação para responder ao crescimento rápido da procura final. Além disso, estas instituições normalmente participam de forma profunda no desenho dos clusters, incluindo armazenamento, configurações de rede e de CPU e outros elementos-chave. Estas transações são frequentemente entregues sob a forma de **bare metal (bare metal)**, porque os laboratórios de IA têm capacidade de engenharia suficiente para personalizar a stack técnica mais profundamente, alcançando assim o melhor TCO (custo total de posse) e desempenho.

Para fornecedores Neocloud, este tipo de transações também é atrativo. Por um lado, podem concentrar recursos de vendas em poucos pedidos de grande volume, sem ter de lidar com um grande número de clientes de menor escala para obter a mesma receita. Por outro lado, contratos longos facilitam também o financiamento de dívida com melhores condições—ao casar os prazos de financiamento com os prazos dos contratos, é possível reduzir eficazmente o risco de “desalinhamento de prazos” e a volatilidade de preços, e na maioria dos casos garantir uma taxa interna de retorno do projeto (IRR) em “dois dígitos” percentuais (dezena de pontos percentuais).

Além disso, hyperscalers também frequentemente atuam como “backstop”—atuam como compradores diretos, adquirem capacidade da Neocloud e depois revendem aos laboratórios de IA. Esta estrutura é vantajosa para todas as partes: a Neocloud pode obter melhores condições de financiamento com base em compradores com rating AAA; e os hyperscalers não precisam expandir o próprio balanço para obter crédito—limitam-se a fornecer suporte de crédito e ficam com uma parte do retorno do projeto.

A tabela abaixo lista alguns dos grandes acordos de “offtake” que estamos a acompanhar. Vamos analisar profundamente estas transações para inferir os preços implícitos por hora de GPU ($/hr/GPU), bem como indicadores-chave de rentabilidade como a IRR do projeto e margens de lucro EBIT.

No contexto do mercado atual, a grande maioria dos grandes clusters que estão a expandir, na prática, é “absorvida internamente” pelos próprios laboratórios de IA. No entanto, essas instituições continuam a entrar no mercado de contratos até 4 anos para complementar capacidade, e ao renovarem clusters H100 e H200 existentes, impedem indiretamente que a oferta volte a entrar nesse mercado. À medida que clusters hyperscale como GB200 e GB300 forem ficando gradualmente operacionais, como evoluirão as relações de oferta e procura no mercado de contratos de 1–3 anos tornar-se-á uma variável importante a observar.

“Para onde vai o disco” (Where The Puck is Going)

O que mais chama a atenção atualmente é o claro desfasamento entre a realidade subjacente e o sentimento do mercado. Embora os sinais de aperto de oferta e de subidas de preços—que deveriam beneficiar a Neocloud (expansão de margens e extensão da vida útil dos ativos)—sejam muito claros, o mercado público está cada vez mais pessimista sobre empresas como CoreWeave, Nebius e Iris Energy; e as suas ações ainda se encontram atualmente nos níveis mais baixos da faixa dos últimos 6–12 meses.

O mercado continua a ser dominado pela narrativa de “excesso final de oferta e mercantilização da capacidade de computação”, e as mudanças acima não aliviaram verdadeiramente as preocupações dos investidores sobre o valor de longo prazo de GPUs. Mas, olhando para a linha da frente, a situação de aperto contínuo da oferta e fortalecimento do poder de precificação significa que quase toda a capacidade de computação está a ser “absorvida” pela procura—mesmo que exista diferença de desempenho, neste ambiente de escassez extrema a oferta não consegue acompanhar.

Três pontos de observação no futuro

Para avaliar se os preços do aluguer de GPUs vão continuar elevados, há três variáveis a focar:

1、Ritmo de expansão dos clusters GB300 (2026)
A chave está na velocidade relativa entre capacidade adicional e procura de tokens—será que a tensão de oferta vai aliviar ou a procura continuará a ultrapassar a oferta? Isto afetará diretamente se os laboratórios de IA continuam a participar no mercado até 4 anos e a trajetória dos preços nesse intervalo.

2、Se a escassez de chips se agravará ainda mais
Inclui capacidade de produção do processo N3 da TSMC, HBM, DRAM, NAND e outros elos críticos; qualquer oscilação a nível de execução fabril pode apertar ainda mais a oferta.

3、Velocidade de crescimento das receitas (ARR) dos laboratórios de IA e do consumo de tokens
A expansão da comercialização da IA e da escala de utilização determinará a intensidade da procura final, que é também a variável central que impulsiona a procura por capacidade de computação.

Preços apenas a subir, retornos a acompanhar

No conjunto, uma conclusão relativamente clara é: a probabilidade de os preços do aluguer de GPUs continuarem a subir é maior do que a de caírem.

Este processo tem características claras de auto-reforço: quando a Neocloud observa aperto de oferta e subidas de preços, bloqueia mais hardware antecipadamente, comprimindo ainda mais a oferta no mercado e empurrando os preços para cima de novo. Isto é semelhante ao ciclo de escassez de GPUs de 2023–2024—naquela altura, a tensão de oferta levou os OEM a concretizarem uma expansão de lucros significativa e a impulsionar subidas acentuadas nos preços de servidores (embora, com um maior grau de maturidade do mercado, esta etapa não necessariamente se repita exatamente).

Ao mesmo tempo, a nova subida dos preços do aluguer de GPUs também está a melhorar o retorno de capital da Neocloud (ROIC):

Por um lado, aumenta a margem de lucro dos ativos já implantados

Por outro, alonga o ciclo económico de utilização das GPUs, permitindo que o capital gere fluxos de caixa durante mais tempo

Quem é o maior beneficiário atual?

O beneficiário mais direto, de forma imediata, é quem tem as seguintes características na capacidade de computação fornecida:

· Contratos dominados por prazos curtos (permite reprecificar rapidamente)

· Grande volume de equipamentos H100 em stock

· Entrada de nova capacidade em curto prazo

A Neocloud com estrutura de aluguer de curto prazo consegue libertar mais rapidamente contratos antigos e recontratar a preços mais altos, realizando assim rapidamente a expansão de lucros. E além disso, hyperscalers que bloqueiam antecipadamente capacidade da próxima geração (contratos multi-ano) e Neoclouds também beneficiarão no próximo ciclo.

Então vem a questão: desta vez, vai mesmo ser “diferente”?

Por que os preços das GPUs estão fora de controlo?

Tópicos em destaque

GateSquareAprilPostingChallenge

WeekendCryptoHoldingGuide

IsraelStrikesIranBTCPlunges

CryptoMarketSeesVolatility

OilPricesRise

Gate Fun tendência

QG

Queen Gate

Oil

oil.T

卐

大侠

T

T0M

lio

lio

Fixar