Os custos de computação de IA estão subindo cada vez mais, e os preços das GPUs, "como o petróleo", flutuam de acordo com a oferta e demanda.

robot
Geração do resumo em andamento

Os custos de infraestrutura de IA estão passando por uma volatilidade intensa, e a imprevisibilidade dos preços dos servidores GPU se tornou um desafio central para provedores de serviços em nuvem e desenvolvedores de IA.

De acordo com o The Information, os preços dos servidores de IA da Nvidia continuaram subindo nos últimos meses, impulsionados pela escassez de chips de memória e outros componentes críticos, com alguns componentes variando até 40% em uma única semana. Essa situação forçou vários provedores de serviços em nuvem a aumentarem sucessivamente os preços de aluguel para desenvolvedores de IA — a Nebius, provedora de GPU em nuvem, aumentou os preços de aluguel de poder computacional sob demanda em cerca de 30% em 1º de junho, e a Amazon AWS anunciou posteriormente que os preços de seus blocos de capacidade EC2 subiriam cerca de 20% a partir de 1º de julho.

A volatilidade acentuada dos preços está remodelando a estrutura de custos de todo o mercado de poder computacional de IA. Carmen Li, CEO da fornecedora de dados de preços Silicon Data, afirmou que os preços de aluguel de GPU cobrados pelos provedores de nuvem de seus clientes já apresentam características de oferta e demanda semelhantes às de mercados de commodities como o petróleo. Clientes de pequeno e médio porte que alugam poder computacional sob demanda são os mais afetados, e a falta de transparência no mecanismo de precificação do mercado agrava ainda mais a desvantagem informacional dos compradores.

Volatilidade intensa nos custos de componentes, janela de precificação de servidores extremamente estreita

A instabilidade dos preços dos servidores GPU tem sua raiz na alta tensão na cadeia de suprimentos upstream.

Segundo uma pessoa que vende servidores Nvidia para provedores de serviços em nuvem, os custos dos componentes necessários para um rack de servidor podem variar até 40% em uma única semana, envolvendo wafers de entrada fabricados pela TSMC, empacotamento co-packaged, rede, resfriamento e, mais significativamente, componentes de memória. Essa pessoa afirmou diretamente que os preços dos racks de servidores GPU "flutuam muito", e "tudo pode mudar completamente em duas ou três semanas; é impossível prever a tendência de preços, só é possível fixar os preços em uma janela extremamente curta", sem capacidade de planejamento de custos de longo prazo.

Um executivo de um provedor de serviços em nuvem de GPU disse que os racks de servidores que sua empresa compra têm subido cerca de 2% a 3% por semana recentemente. Outro executivo de um concorrente apontou que as unidades de armazenamento NVMe nos racks Nvidia Grace Blackwell 300 são a principal fonte de volatilidade de preços, com flutuações "muito intensas" há alguns meses. Atualmente, o custo do rack está 10% a 15% acima do que ele considera o "preço base", e a tendência de aumento para os racks GB300 parece estar se estabilizando, com aumentos mensais de cerca de 1%.

O impacto da volatilidade de preços é amplificado pelo enorme valor absoluto envolvido. Apenas um rack cheio de sistemas de chip Grace Blackwell 300, com cada sistema de chip vendido a US$ 70.000, totaliza cerca de US$ 5 milhões para um rack completo com 72 unidades. Alguns clientes realizam pedidos únicos de milhares de unidades. Segundo um executivo de um cliente que está adquirindo racks Vera Rubin, o preço estimado desse modelo é de cerca de US$ 7 milhões.

O poder de precificação se transmite ao longo da cadeia de suprimentos, com Nvidia e fabricantes de memória dominando

Por trás desse aumento de custos, há uma alta concentração do poder de precificação em vários elos da cadeia de suprimentos.

A pessoa que vende servidores afirmou que a Nvidia "pode exigir praticamente qualquer preço". Um porta-voz da Nvidia respondeu que os preços dependem dos custos dos componentes do rack do servidor, e a empresa colabora com os provedores de servidores na precificação, podendo haver diferenças entre diferentes provedores. Dados mostram que a margem bruta da Nvidia aumentou de 15 a 20 pontos percentuais nos últimos anos, confirmando seu forte poder de precificação no mercado.

Ao mesmo tempo, fabricantes de chips de memória, como a Micron, estão exercendo pressão semelhante sobre a Nvidia e outros clientes, impulsionando aumentos de preços em toda a linha de produtos, desde Macs da Apple até GPUs da Nvidia.

Carmen Li apontou que, uma vez que os chips saem da Nvidia, os preços de aluguel oferecidos pelos provedores de nuvem começam a refletir a lógica de oferta e demanda do mercado de commodities. Seus dados mostram que os preços de aluguel dos chips Blackwell 200 aumentaram cerca de 20% desde o início do ano; os preços de aluguel de chips Nvidia mais antigos, após um aumento acumulado de mais de 20% no último ano, basicamente se estabilizaram nos últimos 30 dias.

Clientes de pequeno e médio porte são os mais pressionados, e há uma falta estrutural de transparência na precificação do mercado

Nessa onda de aumentos de preços, os clientes que alugam poder computacional sob demanda estão na posição mais vulnerável.

Os provedores de serviços em nuvem estão testando os limites superiores de precificação no atual ambiente de oferta restrita de GPU, ou estão direcionando recursos de servidores para grandes clientes, reduzindo a disponibilidade de poder computacional para clientes de pequeno e médio porte. No entanto, a tendência de preços não é unidirecional. Um executivo de uma empresa desenvolvedora de modelos de IA afirmou que, após os preços dobrarem nos últimos um ou dois meses, eles realmente caíram nas últimas duas semanas. Essa divergência reflete que o mercado de serviços em nuvem de GPU ainda está em um estágio relativamente inicial, e com o aumento no número de provedores de serviços em nuvem de GPU, a estrutura do mercado ainda não está consolidada.

A falta de transparência na precificação agrava ainda mais a incerteza dos compradores. Os provedores de serviços em nuvem de GPU geralmente não divulgam publicamente os preços reais, o que significa que o poder de precificação está efetivamente nas mãos dos provedores, e não dos clientes.

Um investidor de um provedor de serviços em nuvem de GPU expressou preocupação: "Para nossos clientes principais, existe um ponto de inflexão — quando a conta econômica não fecha mais, os negócios deles não podem continuar, e nunca queremos cruzar essa linha vermelha." Essa declaração revela que o aumento contínuo dos custos de poder computacional acabará por impor uma restrição substancial à viabilidade comercial da camada de aplicação de IA.

Aviso de risco e termos de isenção

        O mercado envolve riscos, e o investimento deve ser feito com cautela. Este artigo não constitui recomendação de investimento pessoal e não leva em consideração os objetivos de investimento, situação financeira ou necessidades específicas de usuários individuais. Os usuários devem considerar se quaisquer opiniões, pontos de vista ou conclusões neste artigo são adequados às suas circunstâncias específicas. O investimento com base neste artigo é de responsabilidade do próprio leitor.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado