Eis a divisão do poder computacional de IA que poucos estão a interpretar corretamente.


O treino de fronteira está a concentrar-se mais a cada trimestre, milhares de GPUs que têm de estar num único local interligados. Mas o treino representa apenas 30% da procura em 2026. Os outros 70% são inferência, e executá-la num hyperscaler significa pagar por infraestrutura construída para a tarefa mais difícil para fazer a mais fácil.
Em redes distribuídas, essa mesma inferência pode ser 45-75% mais barata e, para quem dimensiona um orçamento de infraestrutura de IA, essa diferença é toda a história.
O treino centraliza-se por necessidade. A inferência fragmenta-se porque pagar margens da AWS por uma carga de trabalho que não as necessita deixa de fazer sentido à escala.
Ver original
post-image
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado