Bernstein a relevé hier son objectif de cours pour Hygon Information de 280 à 450 yuans. La logique centrale est que l'IA agentique bouleverse le schéma des « GPU monopolisant les capex IA » des quatre dernières années, et le rôle du CPU passe du second rôle au premier plan.


Le TAM mondial des CPU de serveurs passe de 39 milliards de dollars en 2025 à 223 milliards de dollars en 2030, multiplié par six.
Hygon, en tant que seul fournisseur mondial de CPU serveur x86 en dehors d'Intel et d'AMD, est le bénéficiaire chinois le plus direct de ce changement structurel.
Voyons d'abord pourquoi l'IA agentique a une demande de CPU complètement différente des LLM traditionnels.
La charge de travail à l'ère des LLM repose sur des opérations matricielles massivement parallèles, pour lesquelles les GPU sont naturellement adaptés. Le ratio GPU:CPU dans les clusters d'entraînement des CSP est passé de 3:1 en 2020 à 8:1 en 2024.
Mais la structure de calcul de l'IA agentique est complètement différente.
L'orchestration des agents, l'appel d'outils, la gestion des fenêtres de contexte, la coordination multi-agents, les boucles d'interaction homme-machine : tout cela relève du traitement séquentiel général, nécessitant une faible latence et une bande passante mémoire élevée, ce sont des tâches pour le CPU.
Le travail du GPU se réduit à la génération de tokens elle-même ; tout le reste revient au CPU.
Les données de Bernstein indiquent que le ratio GPU:CPU s'inversera à 2:1 d'ici 2030, et la part du CPU dans les capex IA des clusters d'inférence passera de 14 % à 50 %.
AMD lui-même a donné une prévision de TAM CPU de 60 milliards de dollars lors de sa journée analystes en novembre 2025, puis l'a doublée à 120 milliards lors de la conférence téléphonique sur les résultats du T1 2026 six mois plus tard.
Intel parvient même à vendre ses puces en stock précédemment dépréciées et mises au rebut, les clients se les arrachant. La tension entre l'offre et la demande est ainsi évidente.
Le TAM des CPU serveur x86 en Chine passe de 7 milliards de dollars en 2025 à 27 milliards de dollars en 2030, mais le rythme de croissance se décompose en deux phases.
De 2025 à 2028, le TCAC est d'environ 31 %, inférieur aux 35 % mondiaux, en raison d'une double contrainte d'offre.
D'une part, la capacité de production d'AMD et d'Intel est prioritairement absorbée par les clients hyperscale américains, et la part allouée à la Chine diminue.
D'autre part, la capacité de production en nœuds avancés de SMIC est limitée, ce qui restreint à la fois le volume des cartes d'accélération IA nationales (la pénurie d'approvisionnement en cartes d'accélération IA réduit directement la demande de CPU associés) et l'allocation de wafers pour Hygon elle-même.
Après 2028, ces deux contraintes se relâchent simultanément.
La mise à l'échelle des capacités de production en nœuds avancés de SMIC et d'autres fonderies nationales, l'augmentation de l'offre de puces IA nationales accélérant le déploiement global des serveurs, couplée à la course aux investissements dans les AIDC menée par les gouvernements locaux, le TCAC du marché chinois des CPU passe à 36 %, commençant à surpasser le monde.
L'évolution des générations technologiques de Hygon mérite un examen attentif.
Ayant débuté en 2016 avec une licence AMD Zen1, Hygon a perdu le support technique ultérieur d'AMD après avoir été inscrit sur la liste des entités en 2019, mais la licence IP Zen1 elle-même ne peut être révoquée rétroactivement.
De Gen2 à G4, sous la contrainte du processus 14 nm (puis converti en SMIC N+1/10 nm équivalent), Hygon a réalisé des améliorations de performances de 30 à 50 % par génération grâce à des améliorations autonomes de l'architecture, du sous-système mémoire et des E/S.
Le G4 atteint déjà 64 cœurs, DDR5, PCIe 5.0, avec un score SPEC2017 int-rate d'environ 1 000, comparable aux Intel Xeon de 4e/5e génération (produits 2022-2023) et AMD Zen3 (2021), l'écart technologique se stabilisant à 2-3 ans.
Une validation latérale intéressante est la vulnérabilité matérielle StackWarp révélée cette année, qui a affecté plusieurs générations de processeurs AMD Zen, mais Hygon n'est pas du tout affecté, car son architecture de sécurité a été remplacée de SEV-SNP d'AMD à son propre CSV3.
Cela montre que la bifurcation au niveau de la microarchitecture est réelle, et non un simple changement de peau.
Le G5 est le point d'appui de toute la logique de croissance.
128 cœurs, 512 threads (SMT4), 16 canaux DDR5, CXL 2.0, microarchitecture entièrement développée en interne, prévu pour être fabriqué sur le nœud SMIC N+2 (équivalent 7 nm).
Bernstein estime que le score SPEC2017 int-rate peut dépasser 2 000, tandis qu'Intel Granite Rapids (128 P-cores, sorti en septembre 2024) obtient 2 440 et AMD Zen5 (2024) obtient 2 089.
Si le G5 sort comme prévu, l'écart entre Hygon et les produits les plus récents mondiaux passera de « deux générations de retard » à « une génération de retard ».
La faisabilité de 128 cœurs ne dépend pas d'une percée de processus, mais de l'encapsulation chiplet.
Au lieu d'un seul die géant de 128 cœurs (le rendement s'effondrerait), on assemble plusieurs petits chiplets de calcul, une approche utilisée par AMD EPYC depuis Zen2.
Sur le nœud équivalent 7 nm de SMIC, on fabrique des dies de calcul de plus petite surface, le rendement est contrôlable, et le nombre total de cœurs dépend du nombre de dies encapsulés.
L'augmentation de +17 % de l'IPC provient de l'expérience de conception complète accumulée sur quatre générations de Gen2 à G4, ainsi que de la maturité des outils EDA nationaux dans la synthèse logique numérique en 7 nm.
Les 16 canaux DDR5 dépendent de l'expansion de la capacité de production DDR5 de ChangXin Memory Technologies et de l'IP du contrôleur CXL de Montage Technology.
Parmi les trois conditions, l'allocation de capacité 7 nm de SMIC est le goulot d'étranglement le plus dur.
Le véritable point de différenciation du Hygon G5 est le SMT4.
512 threads par socket, ce qui est le plus haut niveau parmi tous les CPU serveur actuels.
Les produits grand public d'AMD et d'Intel sont en SMT2.
Dans quels scénarios le SMT4 présente-t-il des avantages ? Services d'inférence multi-locataires (densité de CPU logique doublée, coût par requête d'inférence réduit), couche d'orchestration de l'IA agentique (grand nombre de threads légers liés aux E/S et à la mémoire), et inférence LLM limitée par la mémoire (lorsque les threads attendent les données KV-cache, d'autres threads peuvent utiliser les unités d'exécution).
C'est précisément le plus grand scénario de croissance future du marché chinois.
La Chine a un avantage structurel côté inférence : un faible coût de l'électricité et les capacités d'optimisation de l'inférence LLM démontrées par des sociétés comme DeepSeek signifient une production de tokens plus élevée à puissance de calcul égale.
Si le ratio CPU:GPU des centres de données chinois devient plus élevé que celui des États-Unis, alors le potentiel de hausse de la demande de CPU est encore plus grand que le scénario de base de Bernstein.
Les prévisions de part de marché de Bernstein pour Hygon sont de 19 % en valeur en 2025 à 36 % en 2030, et près de 50 % en volume (en raison d'un ASP inférieur à celui d'Intel/AMD).
La logique se décompose en deux étapes.
La première étape est l'absorption continue de la demande existante du secteur de la confiance numérique (Xinchuang), un socle tiré par les politiques, qui ne dépend pas de la performance absolue.
La deuxième étape est le démarrage des achats commerciaux des CSP après 2027, ce qui constitue la majeure partie de la croissance.
Les clients CSP représenteront environ 75 % du déploiement de serveurs x86 en Chine d'ici 2030.
Pour que Hygon passe d'un taux de pénétration actuel à un chiffre moyen à 20 % sur ce marché, il faut que les performances du G5 soient suffisantes et que l'offre d'AMD/Intel reste tendue.
Hygon dispose également d'un levier unique : le bundle complet CPU+DCU (cartes d'accélération IA).
En période de pénurie d'approvisionnement en puces IA nationales, Hygon peut échanger ses droits d'allocation de DCU contre des volumes d'achat de CPU, et vice versa.
En dehors de Huawei, aucune autre entreprise ne peut faire cela.
La validité de toute cette logique dépend, du côté de l'offre, de la capacité de montée en puissance des nœuds avancés de SMIC à soutenir un volume soutenu du G5, et du côté de la demande, de l'acceptation et de la validation par les clients CSP.
Le G5 a été confirmé en production de masse et expédié en juin, avec des serveurs associés allant du bi-processeur refroidi par air au refroidissement liquide par immersion (80 000+ cœurs par groupe), mais aucune donnée indépendante de benchmark SPEC n'a été publiée pour l'instant.
Le score de 2 000 est une estimation de Bernstein, pas une mesure réelle.
Les achats à grande échelle des CSP nécessitent un cycle de validation POC, du prélèvement d'échantillons à la certification en passant par le déploiement en masse, généralement deux à trois trimestres.
Voyons si des commandes groupées de CSP de premier plan seront concrétisées au second semestre.
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé