Au cours des trois dernières années, le récit central de la course à la puissance de calcul en IA était très uniforme : les fournisseurs de services cloud hyperscale (Hyperscalers) ont étendu leurs centres de données et acheté des GPU avec un quasi mépris des coûts, poussant leurs dépenses d'investissement à des sommets historiques. En 2026, les dépenses d'investissement combinées des quatre grands fournisseurs de cloud – Amazon, Microsoft, Google (Alphabet) et Meta – devraient atteindre 7 250 milliards de dollars, soit une augmentation de 77 % par rapport aux 4 100 milliards de dollars de 2025. Si l'on inclut NVIDIA, Apple, Tesla, etc., dans le groupe des Magnificent Seven, ce chiffre approche les 7 542 milliards de dollars. Gartner prévoit que les dépenses mondiales totales en IA atteindront 2,59 billions de dollars en 2026, soit une augmentation de 47 % sur un an.

Cependant, l'ampleur en elle-même perd sa place de seul point focal. Un changement plus profond est en cours : les dépenses d'investissement en IA passent d'une forte concentration à une dispersion. DIGITIMES définit le mot-clé technologique de 2026 comme étant « dispersion » – symbolisant la double transformation de « décentralisation » que connaissent le marché de l'IA et la chaîne d'approvisionnement. Il ne s'agit pas seulement d'une dispersion géographique, mais d'une restructuration complète des acteurs d'investissement, des architectures technologiques et des structures industrielles.

La fin de la concentration : la « facture » de 7 250 milliards de dollars et l'anxiété liée au retour sur investissement

Pour comprendre le point de départ de la dispersion, il faut d'abord voir clairement le sommet de la concentration.

En 2026, les dépenses d'investissement totales des quatre grands fournisseurs de cloud hyperscale devraient se situer entre 6 500 et 7 000 milliards de dollars, représentant environ 40 % des dépenses d'investissement totales de l'indice Russell 1000, soit le double du niveau de 2024. Les chiffres spécifiques pour chacun sont les suivants : Amazon environ 2 000 milliards de dollars, Microsoft maintient ses prévisions à 1 900 milliards de dollars, Alphabet relève à 1 750 – 1 850 milliards de dollars, et Meta à 1 250 – 1 450 milliards de dollars.

La rapidité de cet ajustement des chiffres est en elle-même un signal important. En seulement environ six mois, les attentes du marché concernant les dépenses d'investissement des fournisseurs de cloud en 2026 ont augmenté de près de 80 %. Barclays prévoit que les dépenses d'investissement des principaux fournisseurs de cloud atteindront 9 190 milliards de dollars en 2027, puis environ 1,16 billion de dollars en 2028. CreditSights estime qu'en 2026, environ 75 % des dépenses d'investissement totales des hyperscalers seront consacrées aux infrastructures liées à l'IA, soit environ 4 500 milliards de dollars de dépenses dédiées à l'IA.

Mais l'expansion concentrée des échelles se heurte à des questions de rentabilité. En juin 2026 (heure de Pékin), l'action Microsoft a chuté de près de 20 % en un mois, et sa capitalisation boursière a fondu de près de 1,3 billion de dollars au cours des 8 derniers mois. L'objet de l'examen minutieux des investisseurs est précisément les dépenses d'investissement d'environ 1 900 milliards de dollars de Microsoft en 2026 – dont environ les deux tiers sont consacrés à des actifs à court terme comme les GPU et CPU, qui se déprécient plus rapidement et sont directement liés aux revenus à court terme. La marge brute de Microsoft Cloud a été guidée à 64 %, en baisse de 4 points de pourcentage par rapport à l'année précédente. Goldman Sachs a souligné dans un rapport de juin que le ratio des investissements technologiques américains par rapport au PIB est passé à environ 4,9 %, dépassant le pic de la bulle Internet autour de l'an 2000.

Le rendement marginal des investissements concentrés diminue, ce qui fournit la motivation la plus directe pour la dispersion.

Le point de bascule de l'inférence : pourquoi la puissance de calcul doit se disperser

La logique sous-jacente de la dispersion des dépenses d'investissement en IA est d'abord le changement de la structure même de la demande de puissance de calcul.

Le PDG de NVIDIA, Jensen Huang, a clairement indiqué lors de la GTC 2026 que la charge de travail d'inférence en IA atteindra des milliards de fois celle de l'entraînement, marquant l'arrivée complète de l'ère de l'inférence. IDC prévoit que d'ici 2027, les tâches d'inférence représenteront plus de 70 % de la demande totale de puissance de calcul intelligente. Les données de TrendForce sont plus spécifiques : en 2026, le taux de croissance annuel de la puissance de calcul d'inférence en IA atteindra 122 %, bien supérieur au taux de croissance de 56 % de la puissance de calcul d'entraînement.

L'entraînement et l'inférence ont des exigences fondamentalement différentes en matière d'infrastructure. L'entraînement est une tâche de calcul centralisée, à haute densité et de longue durée, naturellement adaptée au déploiement dans des centres de données hyperscale. L'inférence est une tâche de réponse en temps réel distribuée, à faible latence et à forte concurrence – lorsqu'un agent IA doit effectuer une inférence et renvoyer un résultat en quelques dizaines de millisecondes, le délai physique de transmission des données du périphérique au centre de données centralisé puis retour devient lui-même un goulot d'étranglement infranchissable.

Un architecte d'Akamai souligne que les scénarios de jeu nécessitent une latence du premier jeton inférieure à 15 millisecondes, les recommandations e-commerce environ 20 millisecondes, alors que la latence réseau entre un centre de données centralisé traditionnel et l'utilisateur final, souvent de plusieurs dizaines de millisecondes, est déjà un goulot d'étranglement insurmontable pour les scénarios interactifs en temps réel. Sous un déploiement centralisé, 1 GW de puissance de calcul nécessite 75 Tbit/s de bande passante sortante (Blackwell), et la prochaine génération Vera Rubin nécessitera 135 Tbit/s ; alors qu'après dispersion sur 20 nœuds, un seul point n'a besoin que de 3,75 Tbit/s. C'est un problème arithmétique dicté par les lois de la physique, et non un choix de stratégie commerciale.

Parallèlement, l'interaction multimodale génère un volume massif de trafic sortant, et le coût élevé de la bande passante du cloud public devient un « tueur invisible » de la rentabilité des activités d'IA. Combiné au resserrement des réglementations sur la localisation des données dans des régions comme le RGPD européen, l'Asie du Sud-Est et le Moyen-Orient, le déploiement centralisé se retrouve dans une situation difficile où l'expérience, les coûts et la conformité sont difficiles à concilier. La puissance de calcul de l'IA ne se concentre plus uniquement dans le cloud central, mais commence à évoluer vers une architecture distribuée à trois niveaux : « cœur – région – périphérie ».

Des quatre géants à l'ensemble de la chaîne industrielle : l'élargissement des participants aux dépenses d'investissement

La deuxième dimension de la dispersion est la diffusion des acteurs d'investissement.

Au cours des trois dernières années, les investissements dans les infrastructures d'IA ont été presque entièrement dominés par les quatre grands fournisseurs de cloud et NVIDIA. Mais en 2026, cette configuration est en train de changer. Les calculs de Zhongtai Securities montrent qu'en 2026, les dépenses d'investissement totales en IA des MAG7 s'élèvent à environ 7 542 milliards de dollars, tandis que les dépenses d'investissement en IA de la Chine continentale totalisent environ 8 058 milliards de yuans (environ 1 100 milliards de dollars). Ensemble, ces deux voies représentent une contribution des dépenses d'investissement en IA sino-américaines au PIB chinois d'environ 10 076 milliards de yuans, soit 0,68 % du PIB, avec une contribution marginale à la croissance du PIB d'environ 0,33 point de pourcentage. Les secteurs amont et aval de l'IA ont dépassé la chaîne des investissements municipaux pour devenir le moteur marginal de la croissance du PIB.

La participation des entreprises s'accélère. Une enquête récente de RBC montre que les entreprises accélèrent l'adoption de l'IA, la plupart passant de l'expérimentation à la production réelle. Une enquête japonaise sur l'utilisation de l'IA par les entreprises nationales montre que 47,8 % des entreprises ont atteint un stade d'utilisation de l'IA en production réelle (本番稼働), et que le taux de mise en production réelle parmi les grandes entreprises atteint 62,7 %. Bien que le taux d'adoption par les PME reste limité (environ 12 % au Japon), le taux d'adoption de 64,7 % parmi les grandes entreprises indique que le déploiement de l'IA en entreprise est passé de la preuve de concept à la phase de passage à l'échelle.

La participation des États souverains est également un facteur à ne pas négliger. Jensen Huang a révélé lors de l'assemblée générale des actionnaires de juin 2026 (heure de Pékin) que près de 40 pays et régions, représentant au total 50 billions de dollars de PIB, sont en train de construire des usines d'IA alimentées par les infrastructures NVIDIA. Les investissements dans les infrastructures d'IA passent d'une « affaire interne des entreprises technologiques » à une « compétition stratégique au niveau national ».

La dispersion des dépenses d'investissement se reflète également dans la structure de financement. Zhongtai Securities note que les dépenses d'investissement des géants américains de l'IA sont entrées dans une phase de financement par endettement. Les dépenses d'investissement des hyperscalers ne dépendent plus entièrement des flux de trésorerie disponibles, mais utilisent l'effet de levier par le biais du financement par emprunt. Ce changement de modèle de financement signifie que la durabilité des dépenses d'investissement ne dépend plus uniquement de la situation de trésorerie d'une seule entreprise, mais est liée à l'environnement plus large du marché du crédit.

La périphérie comme première ligne : la mise en œuvre de l'infrastructure d'IA distribuée

La manifestation la plus concrète de la tendance à la dispersion se trouve dans le domaine de l'informatique de périphérie.

En 2026, l'IA périphérique passe du concept au déploiement à grande échelle. Le « maillage IA » créé par Akamai et NVIDIA a été mis en œuvre, transformant le réseau de plus de 4 400 nœuds périphériques mondiaux en une plateforme d'inférence IA distribuée. Akamai passe d'un fournisseur mondial leader de services de distribution cloud à la plus grande plateforme d'inférence IA distribuée au monde, ayant déjà déployé à grande échelle les GPU NVIDIA Blackwell RTX 6000 PRO.

Cette transformation n'est pas un cas isolé. En juin 2026 (heure de Pékin), l'entreprise d'informatique intelligente périphérique Skytech a finalisé un tour de financement de série E de plus de 1 milliard de yuans, mené par le China Internet Investment Fund. L'entreprise a simultanément annoncé une mise à niveau complète de « fournisseur de services d'informatique intelligente périphérique » à une stratégie de « maillage informatique intelligent en temps réel » pour l'ère de l'AGI. Antimatter a obtenu 300 millions d'euros pour déployer les 100 premiers centres de données micro-distribués Policloud en 2026. NXP a renforcé son portefeuille d'IA périphérique en acquérant Kinara, ajoutant des NPU indépendants.

IDC prévoit que d'ici 2027, plus de 80 % des entreprises déploieront des infrastructures de périphérie distribuées. La croissance de la construction d'infrastructures périphériques dépassera celle des centres de données centraux. Cela signifie que la périphérie n'est plus un complément au cloud, mais devient un composant central de l'infrastructure IA.

La logique commerciale de l'IA périphérique est claire : les tâches d'inférence sont beaucoup plus sensibles à la latence que les tâches d'entraînement, et les nœuds périphériques sont naturellement proches des sources de données et des utilisateurs. Pour les entreprises, le déploiement périphérique résout également de multiples problèmes tels que la conformité des données (données ne sortant pas du pays), les coûts de bande passante (réduction des transferts vers le cloud) et la fiabilité (reprise après sinistre locale). Ces problèmes sont difficiles à résoudre simultanément sous une architecture centralisée, mais trouvent des solutions opérationnelles dans une architecture distribuée.

L'ère de l'infrastructure multi-niveaux : un changement structurel de la logique d'investissement

L'infrastructure IA passe d'une « structure centralisée unique » à une « structure distribuée multi-niveaux ». Ce changement a des implications profondes sur la logique d'investissement.

Premièrement, la structure de la demande de puces évolue. Le côté entraînement est encore dominé par les GPU NVIDIA – au cours de l'exercice 2026, le chiffre d'affaires du centre de données de NVIDIA a atteint 193,7 milliards de dollars, en hausse de 68 % sur un an. Mais la demande diversifiée du côté inférence crée un marché supplémentaire pour les ASIC et les puces périphériques. Les institutions prévoient qu'en 2026, les expéditions de puces ASIC atteindront environ 7,7 millions d'unités, avec une part de marché de 45 %, et devraient dépasser la part des GPU pour atteindre 58 % en 2027. Broadcom pourrait détenir environ 60 % du marché des ASIC de puissance de calcul pour serveurs IA d'ici 2027.

Deuxièmement, la répartition géographique des investissements dans les infrastructures évolue. Les centres de données hyperscale continuent de s'étendre – les investissements mondiaux cumulés dans les centres de données devraient atteindre 1,6 billion de dollars d'ici 2030 – mais la construction de nœuds périphériques croît à un rythme plus rapide. La puissance de calcul de l'IA ne se concentre plus uniquement dans le cloud central, mais se diffuse vers une architecture à trois niveaux : « cœur – région – périphérie ».

Troisièmement, la période d'évaluation du retour sur investissement change. Le cycle de retour sur investissement des centres de données centralisés est long, avec une forte intensité capitalistique, nécessitant plusieurs années pour amortir les coûts. En revanche, les déploiements IA périphériques sont généralement plus petits, ont des cycles plus courts, sont plus proches de scénarios commerciaux spécifiques, et la granularité de l'évaluation du retour est plus fine. Cette différence modifie la logique de valorisation des investissements en IA sur les marchés financiers – passant de « qui dépense le plus » à « qui dépense le plus efficacement ».

Les données de Research and Markets montrent que la taille du marché mondial des infrastructures d'IA passera de 71,88 milliards de dollars en 2025 à 90,91 milliards de dollars en 2026. Mais ce chiffre ne couvre que le marché étroit du matériel d'infrastructure. Si l'on inclut le déploiement de l'IA en entreprise, l'informatique périphérique, les solutions sectorielles, etc., l'ampleur de la dispersion des dépenses d'investissement en IA dépasse largement ce chiffre.

Risques et contraintes : la dispersion n'est pas une voie sans embûches

La tendance à la dispersion des dépenses d'investissement en IA est claire, mais elle n'est pas sans contraintes.

Les goulets d'étranglement du côté de l'offre restent marqués. L'offre de la série Blackwell de NVIDIA est tendue, et la demande dépasse l'offre pendant plusieurs trimestres. La capacité des composants clés comme la HBM a été réservée à l'avance par les grands clients jusqu'en 2026, voire 2027. Bernstein Research souligne que la seule hausse du prix de la HBM pourrait augmenter les dépenses d'investissement en IA des hyperscalers d'environ 30 % au total.

L'infrastructure électrique est une autre contrainte. La demande en électricité des centres de données IA approche les limites de capacité des réseaux électriques existants. L'alimentation électrique d'un cluster de calcul concentré de 1 GW est en soi un projet qui prend plusieurs années. L'architecture distribuée réduit la demande électrique ponctuelle, mais impose de nouvelles exigences quant à la capacité d'accès distribué au réseau électrique.

Les risques géopolitiques sont également à ne pas négliger. Les restrictions américaines à l'exportation de puces IA avancées continuent d'affecter les chaînes d'approvisionnement mondiales. NVIDIA a explicitement exclu l'impact des revenus du centre de données chinois dans ses résultats du premier trimestre de l'exercice 2027. Bien que les dépenses d'investissement en IA américaines et chinoises se reflètent mutuellement étroitement, l'incertitude politique augmente les coûts de friction dans la chaîne d'approvisionnement.

Enfin, la patience des marchés financiers à l'égard du retour sur investissement de l'IA se réduit. Goldman Sachs souligne clairement que la contradiction centrale du marché de l'IA s'aggrave – les fondamentaux restent solides, mais le marché a déjà intégré à l'avance trop de bénéfices futurs. Depuis novembre 2022, la capitalisation boursière des entreprises liées à l'IA a bondi de 27 billions de dollars, bien au-delà des 9 billions de dollars calculés à partir des références macroéconomiques. Si les investissements dispersés ne se transforment pas plus rapidement en revenus et en bénéfices, l'attitude des marchés financiers pourrait passer de « remettre en question l'échelle » à « remettre en question la logique ».

Conclusion

La dispersion des dépenses d'investissement en IA n'est pas un rejet de la concentration, mais un complément et une extension de celle-ci.

L'entraînement a toujours besoin de centres de données hyperscale, l'inférence se dirige vers la périphérie ; les géants continuent d'investir, les entreprises et les États souverains entrent en jeu ; les GPU restent la force principale de l'entraînement, les ASIC et les puces périphériques ouvrent de nouveaux fronts. Nous entrons dans une ère d'infrastructure multi-niveaux – différents niveaux remplissent différentes fonctions, différents participants occupent différentes niches écologiques.

2026 est un point clé de ce changement structurel. DIGITIMES prévoit que la croissance des dépenses d'investissement sur le marché mondial de l'IA passera de 66 % en 2025 à 31 % en 2026, mais un ralentissement ne signifie pas une stagnation. Au contraire, un ralentissement de la croissance indique souvent que l'industrie passe d'une « expansion extensive » à une « construction fine ». L'infrastructure IA évolue d'un marché concentré « gagnant remporte tout » à un écosystème de « collaboration hiérarchisée ».

Pour les investisseurs, comprendre cette évolution structurelle peut être plus important que de suivre les chiffres des dépenses d'investissement du prochain trimestre. La dispersion des dépenses d'investissement en IA remodèle la logique d'investissement à long terme du cloud computing, de la conception de puces, de l'architecture informatique des entreprises et même des politiques industrielles nationales. La destination finale de ce changement est encore inconnue, mais sa direction est déjà suffisamment claire.

FAQ

Q1 : Quels sont les principaux moteurs de la dispersion des dépenses d'investissement en IA ?

La croissance explosive de la demande d'inférence en est le moteur principal. En 2026, le taux de croissance annuel de la puissance de calcul d'inférence en IA atteint 122 %, bien supérieur aux 56 % de l'entraînement. Les exigences de faible latence et de forte concurrence des tâches d'inférence créent un goulot d'étranglement physique pour les centres de données centralisés, faisant des nœuds périphériques distribués un choix inévitable. Parallèlement, des facteurs tels que la conformité des données et les coûts de bande passante poussent également la puissance de calcul vers le bas.

Q2 : Quelles sont les dépenses d'investissement exactes des quatre grands fournisseurs de cloud en 2026 ?

Amazon environ 2 000 milliards de dollars, Microsoft environ 1 900 milliards de dollars, Alphabet environ 1 750 à 1 850 milliards de dollars, Meta environ 1 250 à 1 450 milliards de dollars. Au total, environ 7 250 milliards de dollars, soit une augmentation de 77 % par rapport à 2025. Environ 75 % de ce montant est consacré aux infrastructures liées à l'IA.

Q3 : Quelle est la relation entre l'IA périphérique et le cloud computing ?

Les deux sont complémentaires, et non substituables. Le cloud central est responsable de l'entraînement des grands modèles et de l'inférence complexe, tandis que les nœuds périphériques assurent la réponse en temps réel à faible latence, le prétraitement des données et le traitement localisé pour la conformité. La puissance de calcul de l'IA évolue vers une architecture distribuée à trois niveaux « cœur – région – périphérie », formant un écosystème de collaboration hiérarchisée.

Q4 : Quel est l'impact de la dispersion des dépenses d'investissement en IA sur l'industrie des puces ?

Le côté entraînement reste dominé par les GPU NVIDIA – le chiffre d'affaires du centre de données pour l'exercice 2026 atteint 193,7 milliards de dollars. Mais la demande du côté inférence crée un marché supplémentaire pour les ASIC et les puces périphériques. On prévoit qu'en 2026, les expéditions d'ASIC atteindront environ 7,7 millions d'unités, et leur part de marché pourrait dépasser celle des GPU en 2027 pour atteindre 58 %. La demande de puces évolue d'un « leader unique » à une « coexistence multiple ».

Q5 : Combien de temps la forte croissance des investissements dans les infrastructures d'IA peut-elle durer ?

Barclays prévoit que les dépenses d'investissement des principaux fournisseurs de cloud atteindront 9 190 milliards de dollars en 2027 et environ 1,16 billion de dollars en 2028. La direction de NVIDIA a relevé le plafond des dépenses annuelles de l'industrie de l'IA à 4 billions de dollars d'ici 2030. Mais le taux de croissance lui-même ralentit – passant de 66 % en 2025 à 31 % en 2026 – l'industrie passe d'une « expansion extensive » à une « construction fine ».

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
GateCompletesDividendDistribution
135,19K Popularité
#
StrategyBuybackSurges12%
1,11M Popularité
#
IsraelStrikesIranBTCPlunges
67,28K Popularité
#
PredictWorldCupShare20000U
564,65K Popularité
#
TrumpDisclosesOver100MBTCETH
3,83M Popularité

Épinglé

Les dépenses en capital pour l'IA se distribuent : la deuxième refonte des infrastructures technologiques est en cours.

La fin de la concentration : la « facture » de 7 250 milliards de dollars et l'anxiété liée au retour sur investissement

Le point de bascule de l'inférence : pourquoi la puissance de calcul doit se disperser

Des quatre géants à l'ensemble de la chaîne industrielle : l'élargissement des participants aux dépenses d'investissement

La périphérie comme première ligne : la mise en œuvre de l'infrastructure d'IA distribuée

L'ère de l'infrastructure multi-niveaux : un changement structurel de la logique d'investissement

Risques et contraintes : la dispersion n'est pas une voie sans embûches

Conclusion

FAQ

Sujets populaires

GateCompletesDividendDistribution

StrategyBuybackSurges12%

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

TrumpDisclosesOver100MBTCETH

Épinglé