CITIC Construction Investment : La puissance de calcul IA et l'aérospatiale commerciale entrent dans une période d'accélération industrielle

CITIC Securities Research Report indique que la puissance de calcul de l’IA et l’aérospatiale commerciale entrent dans une période d’accélération industrielle. Du côté de la puissance de calcul, l’évolution des applications reconstruit profondément les infrastructures : l’Agent pousse la charge de calcul du GPU vers le CPU, la proportion CPU-GPU dans les centres de données pourrait augmenter considérablement ; la demande explosive en puissance de calcul de l’IA, combinée à la hausse des prix de la mémoire et à la tension sur la capacité de production, favorise la pénurie et la hausse des prix des CPU de serveurs depuis cette année ; la réduction des coûts pour l’inférence de grands modèles pousse les géants à accélérer le déploiement d’ASIC, l’industrie évolue vers une collaboration hétérogène GPU+ASIC. Du côté de l’aérospatiale, en prenant comme opportunité la Journée de l’aérospatiale 2026, avec la validation intensive de plusieurs types de fusées réutilisables, l’augmentation de la capacité de transport accélérera la mise en réseau de l’Internet par satellite, propulsant l’aérospatiale commerciale vers une phase de développement de haute qualité.

###  Le texte complet est le suivant

Focus sur les opportunités de développement de la puissance de calcul pour l’inférence et de l’aérospatiale commerciale

La puissance de calcul de l’IA et l’aérospatiale commerciale entrent dans une période d’accélération industrielle. Du côté de la puissance de calcul, l’évolution des applications reconstruit profondément les infrastructures : l’Agent pousse la charge de calcul du GPU vers le CPU, la proportion CPU-GPU dans les centres de données pourrait augmenter considérablement ; la demande explosive en puissance de calcul de l’IA, combinée à la hausse des prix de la mémoire et à la tension sur la capacité de production, favorise la pénurie et la hausse des prix des CPU de serveurs depuis cette année ; la réduction des coûts pour l’inférence de grands modèles pousse les géants à accélérer le déploiement d’ASIC, l’industrie évolue vers une collaboration hétérogène GPU+ASIC. Du côté de l’aérospatiale, en prenant comme opportunité la Journée de l’aérospatiale 2026, avec la validation intensive de plusieurs types de fusées réutilisables, l’augmentation de la capacité de transport accélérera la mise en réseau de l’Internet par satellite, propulsant l’aérospatiale commerciale vers une phase de développement de haute qualité.

L’Agent pousse la charge de calcul du GPU vers le CPU, la proportion CPU-GPU dans les centres de données pourrait augmenter considérablement. La déduction des grands modèles LLM en mode requête unique-réponse unique est traditionnelle, mais l’agent implique des cycles de raisonnement complexes en plusieurs étapes, comprenant l’observation de l’environnement, l’exécution du raisonnement, la prise de décision, l’exécution d’actions, la réception de retours, etc., et une seule tâche d’agent peut contenir des dizaines voire plus d’appels LLM. Avec l’augmentation du nombre ou de la complexité des Agents, la charge du module CPU devient plus lourde. À moyen et long terme, l’IA agentique apportera une demande énorme en calcul général, et avec la hausse de la part des tâches d’Agents à haute complexité, la proportion CPU-GPU dans les centres de données IA passera de 1:8 à 1:4 aujourd’hui, à 1:2 à 1:1 à l’avenir, ce qui augmentera considérablement la demande du marché pour les CPU.

La demande explosive en puissance de calcul de l’IA, combinée à la hausse des prix de la mémoire et à la tension sur la capacité de production, favorise la pénurie et la hausse des prix des CPU de serveurs depuis cette année. De la fin 2025 au début 2026, la hausse des prix des CPU montre une progression claire, se propageant du marché grand public à l’entreprise, similaire à la logique de la mémoire. La croissance de la demande en puissance de calcul de l’IA a entraîné une pénurie continue de CPU, d’une part en raison de la croissance de la demande pour le CPU lui-même, d’autre part parce que les matières premières et la capacité de production CPU sont massivement occupées par les fabricants de GPU. Actuellement, la demande globale en CPU est forte, mais la pénurie de composants persiste, la vitesse de livraison des serveurs reste relativement lente, ce qui entraîne un arriéré important de commandes non livrées. Avec la demande rapide d’Agents, la pénurie de CPU à court terme devrait perdurer, et la hausse des prix se poursuivra à court terme.

Les géants mondiaux de la technologie accélèrent leur déploiement de CPU, confirmant l’importance croissante de la CPU dans l’infrastructure de puissance de calcul de l’IA. En mars, Nvidia a commencé à vendre son CPU Vera en tant que produit indépendant, conçu pour l’ère de l’agentique IA et de l’apprentissage renforcé. Arm a également lancé en mars son premier CPU développé en interne — l’Arm AGI CPU, marquant une reconstruction historique du modèle commercial d’Arm, passant de la simple licence d’instructions ou de cœurs standard à la fourniture directe de puces aux fournisseurs de cloud et serveurs. Face à ces ajustements, les géants des CPU comme Intel et AMD s’appuient sur leur expérience dans l’écosystème d’instructions complexes et l’emballage avancé pour construire des barrières défensives via le calcul hétérogène et un écosystème ouvert. Les principaux fournisseurs de cloud comme AWS, Google et Microsoft accélèrent également leur développement interne, entrant rapidement sur le marché des CPU pour serveurs.

Les grands modèles d’IA évoluent de la phase d’entraînement vers celle de l’inférence, le coût par token étant devenu un goulot d’étranglement pour l’expansion des activités des entreprises d’IA. Bien que les GPU généralistes (comme Nvidia) détiennent un avantage écologique évident, le déficit croissant en performance-coût dans le domaine de l’inférence IA limite certains fournisseurs de services de grands modèles. Les puces ASIC, grâce à une meilleure efficacité énergétique sous charge spécifique, une capacité de personnalisation ciblée, et l’élimination des calculs redondants, deviennent la solution optimale pour réduire considérablement le coût par token d’inférence. Selon Marvell, la taille du marché mondial des ASIC IA passera de 6,6 milliards de dollars en 2023 à 55,4 milliards de dollars en 2028, avec un taux de croissance annuel composé de 53 %. À moyen et long terme, avec la généralisation des applications IA, la logique de construction des infrastructures de puissance de calcul passera de l’entraînement à l’efficacité de l’inférence, ce qui stimulera fortement la demande pour les puces ASIC.

Pour réduire les coûts et améliorer l’efficacité tout en évitant les risques liés à la chaîne d’approvisionnement, les principaux acteurs mondiaux de l’IA accélèrent la diversification de leurs sources de puces IA. Face à l’écosystème de plus en plus intégré et verrouillé des GPU généralistes, de plus en plus de grands clients préfèrent des solutions découplées matériel-logiciel pour réduire leurs risques d’approvisionnement. Le 14 avril, Meta et Broadcom ont prolongé leur partenariat pour des puces IA sur mesure (MTIA) jusqu’en 2029, avec un déploiement prévu de plusieurs GW de puissance de calcul en utilisant la technologie avancée 2 nm ; parallèlement, OpenAI, Google, AWS et d’autres renforcent leurs collaborations avec Broadcom ou Marvell pour le développement conjoint de ASIC. Cela montre que les géants technologiques s’éloignent de la dépendance à un seul GPU généraliste, et que le mode de déploiement de la puissance de calcul évolue rapidement d’une monopolisation par un seul fournisseur vers une collaboration hétérogène principalement basée sur GPU + ASIC personnalisé ou développé en interne.

Les startups en chips IA privilégient majoritairement la voie ASIC. Parmi les startups actuelles en chips IA, plus de 60 % ont choisi la voie ASIC, avec trois stratégies différenciées : premièrement, cibler des scénarios extrêmes, comme Cerebras qui abandonne la voie généraliste pour des ASIC conçus pour un entraînement à très grande échelle ou une inférence à très faible latence, comblant ainsi les lacunes des chips généralistes ; deuxièmement, se concentrer sur des scénarios spécifiques et l’optimisation technologique, sans rechercher une performance universelle extrême, en répondant précisément aux besoins verticaux (par exemple, résoudre les goulets d’étranglement de stockage), pour atteindre une rentabilité à grande échelle avec des coûts d’écosystème et de migration client faibles ; troisièmement, adopter une stratégie d’écosystème lié, en utilisant les ressources des grands fabricants x86 ou autres pour un développement personnalisé, complétant ainsi l’écosystème des géants. À l’avenir, avec l’approfondissement de la collaboration hétérogène, l’importance et la part de marché des ASIC dans l’infrastructure de puissance de calcul IA continueront de croître.

La Journée de l’aérospatiale chinoise 2026 approche, avec un focus sur le développement de haute qualité de l’aérospatiale commerciale. Le 17 avril, l’Administration spatiale nationale a organisé une conférence de presse pour la Journée de l’aérospatiale 2026, prévue pour le 24 avril à Chengdu, Sichuan. En 2025, la Chine a réalisé 92 lancements spatiaux, en augmentation de 35 % par rapport à l’année précédente ; dans le domaine de l’aérospatiale commerciale, la construction du système Internet par satellite chinois s’accélère, la production en série de constellations est en cours, avec les premiers vols d’essai des fusées réutilisables Zhuque 3 et Longue Marche 12A. En 2026, la Chine poursuivra ses missions spatiales intensives, avec plusieurs types de fusées réutilisables en validation, notamment la Longue Marche 10B et Zhuque 3, qui devraient prochainement entrer en phase de validation. La diversification de l’offre en fusées devrait accélérer la construction du système Internet par satellite, permettant un développement commercial plus sûr et de haute qualité.

Résumé : La puissance de calcul de l’IA et l’aérospatiale commerciale entrent dans une période d’accélération. Du côté de la puissance de calcul, l’évolution des applications reconstruit profondément les infrastructures : l’Agent pousse la charge de calcul du GPU vers le CPU, la proportion CPU-GPU dans les centres de données pourrait augmenter considérablement ; la demande explosive en puissance de calcul de l’IA, combinée à la hausse des prix de la mémoire et à la tension sur la capacité de production, favorise la pénurie et la hausse des prix des CPU de serveurs depuis cette année ; la réduction des coûts pour l’inférence de grands modèles pousse les géants à accélérer le déploiement d’ASIC, l’industrie évolue vers une collaboration hétérogène GPU+ASIC. Du côté de l’aérospatiale, en prenant comme opportunité la Journée de l’aérospatiale 2026, avec la validation intensive de plusieurs types de fusées réutilisables, l’augmentation de la capacité de transport accélérera la mise en réseau de l’Internet par satellite, propulsant l’aérospatiale commerciale vers une phase de développement de haute qualité.

Avertissements de risques : (1) Risque de déclin macroéconomique : le secteur informatique touche de nombreux secteurs, sous la pression du déclin macroéconomique, une dépense IT inférieure aux attentes affectera directement la demande ; (2) Risque de créances douteuses : la majorité des entreprises informatiques signent principalement par projets, recevant les paiements après validation, un allongement des cycles de paiement pourrait augmenter les créances douteuses et entraîner des pertes de valeur ; (3) Intensification de la concurrence sectorielle : la demande dans le secteur informatique est relativement stable, mais une concurrence accrue pourrait modifier la structure du marché ; (4) Impact des changements dans l’environnement international : la montée des frictions commerciales avec les États-Unis pourrait affecter les entreprises à forte proportion de revenus étrangers.

(Source : Caixin)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler