Fundador de SemiAnalysis: El mercado de inferencia de IA podría superar al petróleo, convirtiéndose en uno de los mercados más grandes a nivel mundial.

El 1 de julio, Dylan Patel, fundador de SemiAnalysis, declaró en una entrevista con el podcast "Training Data" de Sequoia Capital que la inferencia de IA se convertirá en uno de los mercados más grandes del mundo, superando potencialmente al petróleo y representando varios puntos porcentuales del PIB global. Él cree que la cantidad y el valor de las tareas completadas después de cada iteración del modelo continúan expandiéndose a un ritmo más rápido que el crecimiento de la potencia computacional, lo que sugiere que la escasez de potencia computacional podría persistir a largo plazo. Patel predice que para 2030, la demanda combinada de potencia computacional solo de OpenAI y Anthropic superará los 100 gigavatios; en los próximos 3 a 5 años, el impacto de los centros de datos espaciales seguirá siendo insignificante, pero para 2040, más de la mitad de la nueva potencia computacional podría implementarse en el espacio. Indicó que la limitación central radica en el costo de la energía terrestre y la capacidad de generar electricidad. Una vez que la economía de la implementación espacial supere a la de los sistemas terrestres, la migración de la potencia computacional al espacio se volverá inevitable. En cuanto al diseño colaborativo de hardware y software, Patel señaló que el aumento en la eficiencia de la IA en los últimos tres años no provino principalmente del hardware, sino de la optimización colaborativa a nivel de modelo y entre capas. Citó a DeepSeek como ejemplo, afirmando que la forma de su modelo experto está específicamente optimizada para la arquitectura Hopper de NVIDIA, lo que resulta en un rendimiento excelente en Hopper pero deficiente en TPU; el modelo de Anthropic se adapta mejor a TPU, mientras que el modelo de OpenAI se inclina hacia la ruta de GPU. Él cree que el llamado foso de CUDA no es solo CUDA en sí, sino el ecosistema de modelos de código abierto que generalmente optimiza en torno a la colaboración con GPU. Patel también mencionó que el fuerte apoyo del CEO de NVIDIA, Jensen Huang, a las empresas emergentes de computación en la nube tiene como objetivo evitar que los grandes proveedores de nube monopolicen el panorama de la potencia computacional y promover un mercado multipolar. Además, el sistema de evaluación comparativa de inferencia en tiempo real InferenceX, construido por el equipo de SemiAnalysis, muestra que, bajo calidad equivalente, los costos de inferencia han disminuido aproximadamente 60 veces al año, y la inteligencia por vatio ha mejorado alrededor de 40 veces.
DEEPSEEK-0,85%
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado