Os custos de poder computacional de IA estão a aumentar progressivamente, e o preço das GPUs "como o petróleo" varia com a oferta e a procura.

robot
Geração de resumo em curso

Os custos de infraestrutura de IA estão a passar por uma volatilidade acentuada, e a imprevisibilidade dos preços dos servidores GPU tornou-se um desafio central para os fornecedores de serviços na cloud e os programadores de IA.

De acordo com o The Information, impulsionados pela escassez de fornecimento de chips de memória e outros componentes críticos, os preços dos servidores de IA da Nvidia têm vindo a aumentar nos últimos meses, com alguns componentes a registarem flutuações de custo de até 40% numa única semana. Esta situação obrigou vários fornecedores de serviços na cloud a aumentar os preços de aluguer para os programadores de IA – a Nebius, fornecedora de serviços GPU na cloud, aumentou os preços de aluguer de capacidade de computação a pedido em cerca de 30% a partir de 1 de junho, e a Amazon AWS anunciou posteriormente que os preços dos blocos de capacidade EC2 subiriam cerca de 20% a partir de 1 de julho.

A volatilidade acentuada dos preços está a remodelar a estrutura de custos de todo o mercado de capacidade de computação para IA. Carmen Li, CEO da fornecedora de dados de preços Silicon Data, afirmou que os preços de aluguer de GPU cobrados pelos fornecedores de serviços na cloud aos clientes já apresentam características de oferta e procura semelhantes às de mercados de commodities como o petróleo. Os clientes de pequeno e médio porte que alugam capacidade de computação a pedido são os mais afetados, e a falta de transparência no mecanismo de preços agrava ainda mais a desvantagem informacional dos compradores.

Volatilidade acentuada dos custos dos componentes, janela de preços dos servidores extremamente estreita

A instabilidade dos preços dos servidores GPU tem origem na elevada tensão na cadeia de fornecimento de componentes a montante.

Segundo uma fonte que vende servidores Nvidia a fornecedores de serviços na cloud, o custo dos componentes necessários para um rack de servidores pode flutuar até 40% numa única semana, envolvendo wafers de entrada fabricados pela TSMC, empacotamento conjunto, rede, arrefecimento e, mais significativamente, componentes de memória. A fonte afirmou que os preços dos racks de servidores GPU "flutuam violentamente", "tudo pode mudar completamente em duas a três semanas, é impossível prever a tendência dos preços, só se consegue fixar o preço numa janela muito curta", não sendo possível um planeamento de custos a longo prazo.

Um executivo de um fornecedor de serviços GPU na cloud afirmou que os racks de servidores que a sua empresa adquiriu têm aumentado cerca de 2% a 3% por semana recentemente. Outro executivo de um concorrente indicou que as unidades de armazenamento NVMe nos racks Grace Blackwell 300 da Nvidia são a principal fonte de volatilidade de preços, tendo sido "muito violentas" há alguns meses. Atualmente, o custo dos racks está 10% a 15% acima do "preço de referência" por si determinado, e a tendência de aumento para os racks GB300 parece estar a estabilizar, com um aumento mensal de cerca de 1%.

O impacto da volatilidade dos preços é amplificado pelos valores absolutos elevados. Apenas um rack cheio de sistemas de chip Grace Blackwell 300 custa 70.000 dólares por sistema de chip, e um rack completo com 72 sistemas tem um preço total de cerca de 5 milhões de dólares. Alguns clientes adquirem milhares de unidades de uma só vez. Segundo um executivo cliente que está a adquirir racks Vera Rubin, o preço estimado para esse modelo de rack é de cerca de 7 milhões de dólares.

O poder de fixação de preços é transmitido ao longo da cadeia de fornecimento, com a Nvidia e os fabricantes de memória a deterem a liderança

Por detrás deste aumento de custos está uma elevada concentração do poder de fixação de preços em cada elo da cadeia de fornecimento.

A referida fonte de vendas de servidores afirmou que a Nvidia "pode praticamente exigir qualquer preço". Um porta-voz da Nvidia respondeu que o preço depende do custo dos componentes do rack do servidor, que a empresa colabora com os fornecedores de servidores na fixação de preços, e que podem existir diferenças de preços entre diferentes fornecedores. Os dados mostram que a margem bruta da Nvidia aumentou 15 a 20 pontos percentuais nos últimos anos, confirmando o seu forte poder de fixação de preços no mercado.

Entretanto, fabricantes de chips de memória, como a Micron, estão a exercer uma pressão de preços semelhante sobre a Nvidia e outros clientes, impulsionando aumentos de preços numa vasta gama de produtos, desde os Macs da Apple até às GPUs da Nvidia.

Carmen Li apontou que, uma vez que os chips saem da Nvidia, os preços de aluguer praticados pelos fornecedores de serviços na cloud começam a refletir a lógica de oferta e procura dos mercados de commodities. Os seus dados mostram que o preço de aluguer do chip Blackwell 200 aumentou cerca de 20% desde o início do ano; o preço de aluguer de chips Nvidia mais antigos, após um aumento acumulado de mais de 20% no último ano, manteve-se praticamente estável nos últimos 30 dias.

Clientes de pequeno e médio porte são os mais pressionados, falta estrutural de transparência nos preços de mercado

Nesta ronda de aumentos de preços, os clientes que alugam capacidade de computação a pedido encontram-se na posição mais vulnerável.

Os fornecedores de serviços na cloud estão a testar o limite superior de preços no atual ambiente de escassez de GPU, ou a direcionar os recursos de servidores para grandes clientes, reduzindo a capacidade de computação disponível para clientes de pequeno e médio porte. No entanto, a tendência dos preços não é unidirecional. Um executivo de um programador de modelos de IA afirmou que, após os preços terem duplicado nos últimos um a dois meses, na verdade recuaram nas últimas duas semanas. Esta divergência reflete que o mercado de serviços GPU na cloud ainda está numa fase relativamente inicial, e com o aumento acentuado do número de fornecedores, o panorama do mercado ainda não está consolidado.

A falta de transparência nos preços agrava ainda mais a incerteza dos compradores. Os fornecedores de serviços GPU na cloud geralmente não divulgam publicamente os preços reais, o que faz com que o poder de fixação de preços esteja efetivamente nas mãos dos fornecedores, e não dos clientes.

Um investidor de um fornecedor de serviços GPU na cloud expressou preocupação: "Para os nossos clientes principais, existe um ponto crítico – quando as contas económicas já não se justificam, o negócio deles torna-se insustentável, e nós não queremos de forma alguma tocar nessa linha vermelha." Esta declaração revela que o aumento contínuo dos custos de capacidade de computação acabará por impor uma restrição substancial à viabilidade comercial da camada de aplicações de IA.

Aviso de riscos e termos de isenção de responsabilidade

        O mercado apresenta riscos; o investimento requer cautela. Este artigo não constitui aconselhamento pessoal de investimento e também não considera os objetivos de investimento especiais, situação financeira ou necessidades de utilizadores individuais. Os utilizadores devem considerar se quaisquer opiniões, pontos de vista ou conclusões neste artigo se adequam à sua situação específica. Qualquer investimento com base neste artigo é da exclusiva responsabilidade do próprio.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado