Primero, veamos por qué la IA Agéntica tiene una demanda de CPU completamente diferente a la de los LLM tradicionales. La carga de trabajo en la era de los LLM se mapea en operaciones masivas paralelas de matrices, donde la GPU encaja naturalmente. La relación GPU:CPU en los clústeres de entrenamiento de CSP pasó de 3:1 en 2020 a 8:1 en 2024. Pero la estructura computacional de la IA Agéntica es completamente diferente. Orquestación de agentes, llamadas a herramientas, gestión del contexto de ventana, coordinación multiagente, bucle de interacción humano-máquina: todo esto es procesamiento secuencial de propósito general, que requiere baja latencia y alta memoria de ancho de banda, todo trabajo de CPU. El trabajo de la GPU se reduce a la generación de tokens en sí misma, y todo lo demás regresa a la CPU. Los datos de Bernstein indican que la relación GPU:CPU se revertirá a 2:1 para 2030, y la participación de la CPU en el capex de IA de los clústeres de inferencia pasará del 14% al 50%.

AMD, en su día de analistas de noviembre de 2025, dio una expectativa de TAM de CPU de 60 mil millones de dólares, y seis meses después, en la conferencia telefónica de resultados del primer trimestre de 2026, se duplicó a 120 mil millones. Intel incluso pudo vender chips de inventario previamente dados de baja como pérdida, y los clientes los buscaban. Se puede ver la tensión entre oferta y demanda.

El TAM de CPU x86 para servidores en China pasa de 7 mil millones de dólares en 2025 a 27 mil millones en 2030, pero el ritmo de crecimiento tiene dos fases. De 2025 a 2028, la CAGR es de aproximadamente el 31%, inferior al 35% global, debido a una doble restricción de suministro. Por un lado, la capacidad de producción de AMD e Intel es absorbida prioritariamente por clientes hiperescala estadounidenses, y la participación asignada a China se está reduciendo. Por otro lado, la capacidad limitada de procesos avanzados de SMIC restringe tanto el volumen de las tarjetas de aceleración de IA domésticas (la insuficiente oferta de tarjetas de aceleración de IA suprime directamente la demanda de CPU complementaria) como la asignación de obleas de Haiguang. Después de 2028, ambas restricciones se alivian simultáneamente. La capacidad de nodos avanzados de SMIC y otros foundries domésticos se libera a gran escala, el suministro de chips de IA domésticos aumenta, lo que acelera el despliegue general de servidores, y combinado con la inversión en AIDC liderada por gobiernos locales, la CAGR del mercado de CPU en China aumenta al 36%, comenzando a superar la tasa global.

La evolución generacional tecnológica de Haiguang merece un análisis detallado. Comenzó en 2016 con la licencia de AMD Zen1. En 2019, tras ser incluida en la lista de entidades, perdió el soporte técnico posterior de AMD, pero la licencia de propiedad intelectual de Zen1 en sí misma no puede revocarse retroactivamente. Desde la Gen2 hasta la G4, bajo la restricción del proceso de 14nm (posteriormente convertido a SMIC N+1/equivalente a 10nm), Haiguang logró una mejora de rendimiento del 30-50% por generación mediante mejoras independientes en la arquitectura, el subsistema de memoria y la E/S. La G4 ya tiene 64 núcleos, DDR5, PCIe 5.0, y una puntuación SPEC2017 int-rate de aproximadamente 1000, comparable a los productos Intel Xeon de cuarta/quinta generación (productos de 2022-2023) y AMD Zen3 (productos de 2021), con una brecha tecnológica estable de 2-3 años. Una verificación lateral interesante es la vulnerabilidad de hardware StackWarp revelada este año que afectó a múltiples generaciones de procesadores AMD Zen, mientras que Haiguang no se vio afectado en absoluto, porque su arquitectura de seguridad ya se ha reemplazado del SEV-SNP de AMD por el CSV3 desarrollado internamente. Esto demuestra que la bifurcación a nivel de microarquitectura es real, no un simple cambio de nombre.

La G5 es el punto clave de toda la lógica de crecimiento. 128 núcleos, 512 hilos (SMT4), 16 canales DDR5, CXL 2.0, microarquitectura completamente autodesarrollada, y se espera que se fabrique en SMIC N+2 (equivalente a 7nm). Bernstein estima que la puntuación SPEC2017 int-rate podría superar los 2000, mientras que Intel Granite Rapids (128 P-cores, lanzado en septiembre de 2024) obtiene 2440, y AMD Zen5 (2024) obtiene 2089. Si la G5 sale según lo planeado, la brecha de Haiguang con los productos más recientes globales se reducirá de "dos generaciones de diferencia" a "una generación de diferencia".

La viabilidad de 128 núcleos no depende de un avance en el proceso, sino del empaquetado chiplet. En lugar de un solo dado masivo de 128 núcleos (lo que colapsaría el rendimiento), se combinan múltiples chiplets de cómputo más pequeños, siguiendo la ruta que AMD EPYC ha utilizado desde Zen2. En el nodo equivalente a 7nm de SMIC, se fabrican dados de cómputo de área más pequeña, con un rendimiento controlable, y el número total de núcleos depende de cuántos dados se empaqueten. La mejora del +17% en IPC proviene de la experiencia acumulada en diseño de flujo completo a lo largo de cuatro generaciones desde Gen2 hasta G4, combinada con la madurez de las herramientas EDA domésticas en la síntesis lógica digital de 7nm. Los 16 canales DDR5 dependen de la expansión de capacidad de DDR5 de ChangXin Memory y del IP del controlador CXL de Montage Technology. De las tres condiciones, la asignación de capacidad de 7nm de SMIC es el cuello de botella más duro.

El verdadero diferenciador de la G5 de Haiguang radica en SMT4. 512 hilos por zócalo, el nivel más alto entre todas las CPU de servidor actuales. Los productos principales de AMD e Intel son SMT2. ¿En qué escenarios tiene ventaja SMT4? Servicios de inferencia multiinquilino (la densidad de núcleos lógicos se duplica, el costo por solicitud de inferencia disminuye), la capa de orquestación de IA Agéntica (muchos hilos ligeros con límite de E/S y memoria), e inferencia LLM con memoria limitada (cuando un hilo espera datos de KV-cache, otros hilos pueden utilizar las unidades de ejecución). Esto coincide exactamente con el mayor escenario incremental futuro en el mercado chino. China tiene una ventaja estructural en el lado de la inferencia: bajo costo de electricidad combinado con la capacidad de optimización de inferencia LLM demostrada por empresas como DeepSeek, lo que significa una mayor producción de tokens con la misma capacidad de cómputo. Si la relación CPU:GPU en los centros de datos chinos es, por lo tanto, más alta que en Estados Unidos, entonces el potencial alcista de la demanda de CPU es aún mayor que el caso base de Bernstein.

La predicción de participación de mercado de Bernstein para Haiguang es del 19% en valor en 2025 al 36% en 2030, y cerca del 50% en volumen de envíos (debido a un ASP más bajo que Intel/AMD). La lógica tiene dos pasos. El primero es la absorción continua de la demanda existente de Xinchuang, que es una base impulsada por políticas y no depende del valor absoluto del rendimiento. El segundo es el inicio de compras comerciales por parte de los CSP después de 2027, que representa la mayor parte del incremento. Para 2030, los CSP representarán aproximadamente el 75% del despliegue de servidores x86 en China. Para que Haiguang pase de una penetración actual de un solo dígito medio al 20% en este mercado, se requiere que el rendimiento de G5 sea suficiente, y que la oferta de AMD/Intel se mantenga ajustada. Haiguang también tiene una palanca única: el paquete completo de CPU+DCU (tarjeta de aceleración de IA). Durante el período de escasez de chips de IA domésticos, Haiguang puede intercambiar derechos de asignación de DCU por volúmenes de compra de CPU, y viceversa. Aparte de Huawei, ninguna otra empresa puede hacer esto.

La validez de toda esta lógica depende, del lado de la oferta, de si la rampa de capacidad de nodos avanzados de SMIC puede soportar el volumen continuo de G5, y del lado de la demanda, de la verificación de aceptación real por parte de los clientes CSP. En junio, se confirmó que G5 ha comenzado la producción en volumen y envío, con servidores compatibles que van desde biprocesador refrigerado por aire hasta refrigeración líquida por inmersión (un solo grupo de más de 80,000 núcleos), pero hasta ahora no hay datos públicos independientes de la puntuación SPEC. 2000 puntos es una estimación de Bernstein, no una medición real. Las compras a gran escala de los CSP requieren un ciclo de verificación POC, desde el envío de muestras hasta la certificación de calificación y el lanzamiento en lote, que normalmente toma de dos a tres trimestres. Veamos si en la segunda mitad del año se concretan órdenes de compra centralizadas de los principales CSP.

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
gStocksTokenizedStocksLive
4,75M Popularidad
#
StrongNonfarmPayrollsRekindleRateHikeFear
1,04M Popularidad
#
IsraelStrikesIranBTCPlunges
68,04K Popularidad
#
PredictWorldCupShare20000U
201,63K Popularidad
#
ETHBreaks1700
152,56M Popularidad

Fijado

Temas de actualidad

gStocksTokenizedStocksLive

StrongNonfarmPayrollsRekindleRateHikeFear

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

ETHBreaks1700

Fijado