Aqui está a divisão na computação de IA que poucos estão interpretando corretamente.


O treinamento de fronteira está se concentrando cada vez mais a cada trimestre, milhares de GPUs que precisam ficar em um único lugar interligadas. Mas o treinamento é apenas 30% da demanda em 2026. Os outros 70% são inferência, e executá-la em um hyperscaler significa pagar por uma infraestrutura construída para a carga de trabalho mais difícil para fazer a mais fácil.
Em redes distribuídas, essa mesma inferência poderia ser executada de 45 a 75% mais barata, e para qualquer pessoa que esteja dimensionando um orçamento de infraestrutura de IA, essa diferença é a história toda.
O treinamento se centraliza por necessidade. A inferência se fragmenta porque pagar margens da AWS por uma carga de trabalho que não precisa delas deixa de fazer sentido em escala.
Ver original
post-image
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado