Escassez de GPU Reocorre: Fornecedores de Nuvem Aumentam Restrição de Oferta, Startups de IA Enfrentam Aumento de 32% no Preço de Aluguel de Chips e Longas Esperas até ao Fim do Ano

De acordo com monitorizações da Beating, várias startups de IA relataram que fornecedores de cloud como a Microsoft e a Amazon estão a concentrar o poder de computação GPU nas suas equipas internas e nos principais clientes (como a OpenAI e a Anthropic), deixando clientes de pequeno a médio porte a enfrentar aumentos de preços, longos tempos de espera e condições contratuais mais rígidas. Recentemente, a gestão de vendas do Azure da Microsoft informou os funcionários que o tempo de espera por GPUs para clientes de cloud deve durar até ao final de 2026. Um caso específico envolve a startup de geração de imagens Krea (que levantou $83 milhões, com investidores incluindo a Andreessen e a Bain Capital Ventures) que alugou centenas de chips Blackwell por 2,80 dólares por cartão por hora há seis meses, sob um contrato de seis meses. Quando chegou a hora de renovar, vários fornecedores de cloud não atenderam às chamadas, e o acordo final foi fechado a 3,70 dólares por hora, um aumento de 32%, com o contrato estendido para um ano. O CEO Victor Perez afirmou que alguns fornecedores não responderam de todo, enquanto outros apenas participaram de discussões para contratos de três anos. Will Falcon, CEO do fornecedor de cloud GPU Lightning AI, revelou que a empresa tem 40.000 GPUs online, mas a procura total de cerca de 40 clientes na fila atinge 400.000 GPUs, com os preços de aluguer a aumentar mais de 25% em seis meses. A Microsoft implementa uma gestão escalonada para o acesso às GPUs: aproximadamente 1.000 maiores clientes (Tier 1) são priorizados; clientes menores que desejem alugar chips Blackwell devem comprometer-se a pelo menos 1.000 unidades por um mínimo de um ano, com contratos a partir de dezenas de milhões de dólares. Clientes pay-as-you-go podem ter o seu acesso revogado pela Microsoft se as suas GPUs ficarem ociosas por várias horas. Startups participantes no programa de quota gratuita ‘Microsoft for Startups’ também foram informadas de que o uso insuficiente resultará na retirada do acesso às GPUs. Hemant Taneja, sócio da General Catalyst, consultou empresas do portfólio sobre os obstáculos de capacidade de computação, e a firma planeia criar um pool de computação partilhado ou uma negociação coletiva para as empresas investidas. Algumas startups estão a começar a considerar a compra direta de GPUs: a startup de IA Collide, na indústria petrolífera, planeia gastar cerca de 500.000 dólares para comprar diretamente GPUs NVIDIA e alugar espaço em data centers para operar de forma independente, a fim de evitar filas e incertezas.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar