Aquí está la división en computación de IA que pocos están leyendo correctamente.


El entrenamiento de frontera se concentra más cada trimestre, miles de GPU que deben estar en un mismo lugar interconectadas. Pero el entrenamiento es solo el 30% de la demanda en 2026. El otro 70% es inferencia, y ejecutarla en un hiperescalador significa pagar por una infraestructura construida para la carga de trabajo más difícil para hacer la más fácil.
En redes distribuidas, esa misma inferencia podría costar entre un 45 y un 75% menos, y para cualquiera que esté dimensionando un presupuesto de infraestructura de IA, esa brecha es toda la historia.
El entrenamiento se centraliza por necesidad. La inferencia se fragmenta porque pagar los márgenes de AWS por una carga de trabajo que no los necesita deja de tener sentido a escala.
Ver original
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado