Pourquoi les centres de données IA ne peuvent-ils pas se reposer uniquement sur les GPU ? Analyse des mécanismes de coordination entre mémoire, réseau et stockage.

En juin 2026, le Bitcoin oscille autour du seuil des 60 000 dollars, tandis que l'Ether évolue dans la fourchette des 1 600 dollars, le marché des cryptomonnaies étant en phase de consolidation. Cependant, un autre secteur – l'infrastructure des centres de données IA – affiche une dynamique totalement différente. Gartner prévoit que les dépenses mondiales en TI atteindront 6 310 milliards de dollars en 2026, soit une augmentation de 13,5 % sur un an, les dépenses liées aux systèmes des centres de données menant toutes les catégories avec une croissance de 55,8 %. IDC estime quant à lui que les dépenses mondiales des entreprises en IA atteindront 940 milliards de dollars en 2026.

Dans cette course à la puissance de calcul, un changement de perception clé est en train de s'opérer : la compétitivité d'un centre de données IA ne dépend plus uniquement du nombre de GPU et du pic de puissance de calcul, mais de plus en plus de la capacité de coordination globale entre le calcul, le stockage et le réseau au sein du cluster. Comprendre comment la mémoire, le réseau et le stockage fonctionnent en synergie est devenu une compétence de base pour évaluer la valeur d'investissement dans l'infrastructure IA.

Le mur de la mémoire : première contrainte à l'ère des grands modèles

La taille des paramètres des grands modèles d'IA a connu une croissance exponentielle au cours des deux dernières années. De 2024 à 2026, le nombre de paramètres des grands modèles dominants a été multiplié par cent, et la fenêtre contextuelle est passée de quelques milliers de caractères à des millions. Cependant, la bande passante de la mémoire des serveurs n'a augmenté que de moins de 15 % par an, bien en deçà de la croissance des activités IA. Ce décalage important entre les rythmes d'itération du matériel et du logiciel fait du « mur de la mémoire » le goulot d'étranglement principal limitant le déploiement de la puissance de calcul IA.

Le mur de la mémoire, en substance, est le fait que la vitesse d'amélioration de la puissance de calcul des CPU/GPU dépasse de loin celle de la bande passante et de la latence de lecture/écriture de la mémoire. Les puces de calcul sont extrêmement rapides, mais l'accès aux données ne suit pas, ce qui entraîne une inactivité importante des processeurs. Selon des rapports de tests sectoriels, dans un cluster de 10 000 GPU, le goulot d'étranglement des E/S de données peut entraîner un temps d'inactivité des GPU allant jusqu'à 40 % – ce qui signifie que près de la moitié du temps, ces puces de calcul coûteuses attendent le transfert des données.

La rareté des ressources mémoire est tout aussi frappante. Un seul serveur d'inférence IA consomme plus de dix fois la DRAM et la HBM d'un serveur de centre de données traditionnel. Près de 60 % de la capacité mondiale de production de tranches de DRAM est déjà accaparée par les clusters IA. La HBM, quant à elle, est en rupture de stock chronique, avec une capacité de production déjà réservée par les grands clients jusqu'en 2026, voire 2027. Gartner souligne que la forte demande, combinée aux contraintes d'approvisionnement, a porté les prix de la HBM à des niveaux historiquement élevés, faisant de la mémoire un secteur très rentable pour les fabricants de semi-conducteurs.

Pour briser le mur de la mémoire, le secteur avance sur deux fronts : d'une part, l'optimisation logicielle fine de l'ordonnancement et de la compression, en utilisant des techniques telles que l'ordonnancement hiérarchisé du cache KV et la quantification à faible bit pour optimiser l'utilisation des ressources de stockage existantes ; d'autre part, la refonte architecturale au niveau matériel, notamment l'itération de la HBM et le déploiement de nouveaux protocoles d'interconnexion mémoire comme CXL (Compute Express Link). La nouvelle plateforme HGX Rubin de Nvidia a déjà multiplié par trois la bande passante mémoire du GPU, atteignant 176 To/s. Ces deux approches ne sont pas substitutives, mais complémentaires pour remodeler la logique de collaboration entre le stockage et le calcul tout au long de la chaîne industrielle.

Le réseau : le « système nerveux » du cluster IA

Si la mémoire résout l'efficacité du transfert de données au sein d'un nœud, le réseau résout le problème du flux de données entre les nœuds. Dans un cluster IA à grande échelle, des centaines, voire des milliers de GPU doivent collaborer pour effectuer une tâche d'entraînement ou d'inférence d'un modèle. L'efficacité de la communication entre GPU a un impact direct sur la vitesse globale d'entraînement.

Le goulot d'étranglement de la bande passante est à plusieurs niveaux : entre les puces, l'interconnexion traditionnelle sur carte PCB ne peut plus répondre aux besoins de bande passante élevée et de faible latence des puces IA ; à l'intérieur des baies, la bande passante d'interconnexion entre serveurs devient une contrainte pour l'expansion verticale ; entre les centres de données, la bande passante et la latence des transmissions longue distance limitent l'expansion horizontale et l'efficacité de l'ordonnancement interrégional de la puissance de calcul. Selon les estimations, dans les clusters d'entraînement IA actuels, la consommation énergétique du transfert de données dépasse déjà celle du calcul lui-même.

Le NVLink et l'InfiniBand de Nvidia dominent depuis longtemps le marché de l'interconnexion interne des clusters IA. Leur dernier commutateur NVLink atteint une bande passante de 28,8 To/s, soit le double de la génération précédente. Mais cette configuration est remise en question : AMD, Broadcom et d'autres fabricants développent leurs propres solutions d'interconnexion, et des normes ouvertes comme UALink (Ultra Accelerator Link) se concrétisent rapidement. En 2026, le secteur du réseau est passé d'un « monopole Nvidia » à une « concurrence multi-normes », ce qui impose des exigences plus élevées en matière de capacité d'intégration système pour les opérateurs de centres de données.

Le stockage : de l'« entrepôt » au « pipeline de données »

Dans un centre de données traditionnel, le stockage joue le rôle d'un « entrepôt de données » – principalement utilisé pour la conservation et l'archivage des données froides. Mais dans un centre de données IA, le rôle du stockage a évolué pour devenir un « pipeline de données » – il doit fournir en continu des données d'entraînement aux nœuds de calcul à très grande vitesse, et prendre en charge l'accès à faible latence aux paramètres du modèle dans les scénarios d'inférence.

L'entraînement IA nécessite une lecture à grande vitesse de quantités massives de données brutes, tandis que l'inférence nécessite un accès rapide aux poids du modèle et au cache KV. Le cache KV commence à s'étendre de la HBM du GPU à la DRAM du système, voire aux SSD locaux à haute vitesse. Cela signifie que la frontière entre le stockage et la mémoire s'estompe : les périphériques de stockage ne sont plus seulement le point final des données, mais des nœuds clés du pipeline de flux de données.

Le stockage tout-flash est en train de remplacer les disques durs mécaniques traditionnels comme choix principal dans les centres de données IA. Les produits de stockage tout-flash et d'interconnexion réseau native à haute vitesse présentés par Sugon (Sugon) à l'ISC High Performance 2026 illustrent cette tendance. Les performances de stockage déterminent directement si les données peuvent être livrées à temps aux unités de calcul, et donc le taux d'utilisation des GPU.

Synergie « calcul-stockage-réseau » : de l'optimisation ponctuelle à l'optimisation système

Une fois compris les rôles et les goulots d'étranglement de ces trois éléments, la signification de la « synergie » devient claire : la puissance de calcul réelle d'un centre de données IA n'est pas la simple addition de la puissance de calcul GPU, de la bande passante mémoire, du débit réseau et des IOPS de stockage, mais le rendement effectif de ces quatre éléments couplés au niveau système.

La croissance continue de la taille des paramètres des grands modèles donne naissance à des clusters IA superpuissants. La qualité de la puissance de calcul ne dépend plus uniquement des performances des puces, mais de plus en plus de la capacité de coordination globale et de l'efficacité du calcul, du stockage et du réseau au sein du cluster. Ce constat devient un consensus sectoriel.

D'un point de vue pratique, la conception « calcul-stockage-réseau » étroitement couplée est devenue la norme pour les fabricants leaders. Le scaleX AI Supercluster de Sugon (Sugon) adopte une conception à couplage serré du calcul, du stockage et du réseau, améliorant considérablement l'efficacité de l'entraînement et de l'inférence. Le système d'exploitation d'inférence Dynamo 1.0 de Nvidia, associé à la plateforme BlueField-4 CMX, connecte le GPU, la HBM, la DRAM hôte, le flash local et le stockage distant, brisant l'isolement de la mémoire de chaque carte grâce à l'acheminement automatique des données chaudes et froides.

Dans son rapport de juin 2026, IDC indique clairement que l'avantage concurrentiel dans le domaine de l'IA s'est déplacé : le plus important n'est plus de disposer de la puissance de calcul la plus forte, mais de la manière de transformer l'IA en une capacité commerciale durable au coût le plus bas par token. Et la composante principale du coût par token est l'efficacité combinée du calcul, de la mémoire, du réseau et du stockage.

Le paysage du marché : qui en bénéficie ?

Cette tendance sectorielle se reflète pleinement sur les marchés financiers.

Côté mémoire, SK Hynix est sans conteste le titre le plus brillant de 2026. Le 22 juin 2026, l'action SK Hynix a bondi de 6 %, atteignant un sommet historique de 2 944 000 wons, dépassant Samsung pour devenir la première capitalisation boursière de Corée du Sud, avec une progression de plus de 349 % depuis le début de l'année. Micron a également affiché de solides performances, avec des résultats trimestriels la dernière semaine de juin montrant un chiffre d'affaires plus que quadruplé sur un an, et a annoncé 16 accords d'approvisionnement à long terme. L'action Micron a grimpé de 16 % le jour de la publication des résultats.

Côté réseau, l'action du fournisseur de câbles optiques Corning a atteint un sommet historique la dernière semaine de juin. Son rôle clé dans les centres de données IA est en train d'être réévalué par le marché. Les commandes d'infrastructure IA de Cisco ont dépassé les 9 milliards de dollars.

Côté serveurs et intégration de systèmes, le chiffre d'affaires trimestriel des serveurs optimisés pour l'IA de Dell a atteint 16,1 milliards de dollars, soit une augmentation de 757 % sur un an. Supermicro détient environ 70 % de parts de marché dans la technologie de refroidissement liquide direct.

Côté exploitation de centres de données, BOCOM International a classé GDS-SW et SUNEVISION comme achats prioritaires dans le secteur des centres de données, estimant que l'IA générative a déclenché une croissance explosive de la demande. UBS a également noté que le secteur chinois des centres de données Internet devrait accélérer nettement à partir du second semestre 2026.

Comment participer à l'investissement dans l'infrastructure des centres de données IA via la plateforme Gate ?

La plateforme Gate a répertorié plus de 12 500 actions et ETF sur les marchés américain, hongkongais et sud-coréen. Les investisseurs peuvent utiliser des actifs numériques comme l'USDT via un compte unifié pour négocier directement des actions mondiales, réalisant ainsi une allocation combinée d'actifs cryptographiques et d'actifs traditionnels.

Dans le domaine de l'infrastructure des centres de données IA, Gate couvre l'ensemble de la chaîne industrielle, des puces aux applications :

Sur le marché américain, les investisseurs peuvent négocier Nvidia (NVDA), AMD, Micron (MU), Broadcom (AVGO), Dell (DELL), Supermicro (SMCI), Corning (GLW), Cisco (CSCO) et d'autres entreprises clés. Gate prend en charge les transactions avant et après l'ouverture des marchés, avec des horaires de trading étendus à 16×5, permettant aux utilisateurs de réagir plus rapidement aux rapports financiers et aux données macroéconomiques.

Sur le marché hongkongais, on peut s'intéresser aux opérateurs de centres de données comme GDS (09698.HK) et SUNEVISION (01686.HK).

Sur le marché sud-coréen, SK Hynix (000660.KS) est le leader incontesté de la HBM ; Jeju Semiconductor joue un rôle clé en amont dans les matériaux de communication optique pour les centres de données IA.

Le trading d'actions sur Gate prend en charge des frais aussi bas que 0,1 %, avec des modes de trading à effet de levier et au comptant. Les utilisateurs bénéficient de frais VIP exclusifs dès qu'ils détiennent 2 000 $ US. Pour les investisseurs souhaitant une allocation systématique dans le secteur de l'infrastructure des centres de données IA, la capacité de trading transversale multi-marchés et multi-actifs de Gate réduit les barrières à l'allocation d'actifs technologiques mondiaux.

Conclusion

Les centres de données IA passent de l'ère grossière de l'« empilement de GPU » à l'ère fine de l'« optimisation système ». La mémoire, le réseau et le stockage ne sont plus des composants d'infrastructure isolés, mais des variables système qui, dans le cadre de la synergie « calcul-stockage-réseau », déterminent conjointement la production réelle de puissance de calcul IA.

Comprendre cette logique aide non seulement à évaluer les tendances technologiques, mais fournit également un cadre d'analyse plus solide pour les décisions d'investissement – des puces à la mémoire, du réseau au stockage, des serveurs à l'exploitation des centres de données, la réévaluation de la valeur de l'ensemble de la chaîne industrielle ne fait que commencer. Et alors que les fluctuations à court terme du marché des cryptomonnaies convergent avec le récit à long terme de l'infrastructure IA, une fenêtre d'allocation couvrant à la fois les actifs numériques et l'industrie physique s'ouvre.

FAQ

Q1 : Pourquoi un centre de données IA ne peut-il pas résoudre le problème de puissance de calcul en empilant simplement des GPU ?

Le GPU n'est que le terminal de sortie de la puissance de calcul. Son efficacité dépend fortement de la capacité de la bande passante mémoire à fournir des données en temps opportun, de la capacité du réseau à coordonner efficacement le parallélisme multi-GPU, et de la capacité du stockage à répondre rapidement aux lectures et écritures massives de données. Dans un cluster de 10 000 GPU, le goulot d'étranglement des E/S de données peut entraîner un temps d'inactivité des GPU allant jusqu'à 40 % – empiler simplement des GPU sans résoudre cette synergie entraîne un gaspillage de puissance de calcul considérable.

Q2 : Pourquoi la HBM est-elle si rare ?

La HBM (mémoire à large bande passante) est la mémoire standard des puces IA. Son processus de fabrication est complexe, et le cycle d'expansion de la capacité de production est de plus de deux ans. En 2026, la demande d'inférence IA dépasse celle de l'entraînement, ce qui stimule encore la demande de HBM et de DRAM de grande capacité. La capacité de production principale est déjà réservée par les grands clients jusqu'en 2026, voire 2027, ce qui rend l'élasticité de l'offre à court terme extrêmement limitée.

Q3 : Quelle est la logique fondamentale de l'investissement dans l'infrastructure des centres de données IA ?

La logique fondamentale est le passage d'une « domination de l'entraînement » à une « explosion de la demande sur toute la pile ». Microsoft, Google, Amazon et Meta, quatre géants technologiques, ont des dépenses d'investissement combinées en infrastructure IA de 725 milliards de dollars en 2026. Ce niveau de financement ne peut être porté par un seul maillon ; l'ensemble de la chaîne industrielle – des puces, de la mémoire, du réseau à l'exploitation des centres de données – se trouve dans un cycle de bénéfices structurels.

Q4 : Comment négocier les actions liées aux centres de données IA sur la plateforme Gate ?

Gate a répertorié plus de 12 500 actions et ETF sur les marchés américain, hongkongais et sud-coréen. Les utilisateurs peuvent déposer des actifs numériques comme l'USDT, puis négocier des titres clés de l'infrastructure IA comme Nvidia, Micron et SK Hynix dans un compte unifié. La plateforme prend en charge les transactions avant et après l'ouverture des marchés, les modes à effet de levier et au comptant, avec des frais aussi bas que 0,1 %.

Q5 : Quels sont les risques d'investissement dans l'infrastructure des centres de données IA ?

Les principaux risques sont : premièrement, un déséquilibre entre l'offre et la demande pourrait entraîner une surcapacité temporaire – BOCOM International note qu'il faut surveiller les déséquilibres temporaires potentiels entre l'offre et la demande et la volatilité des valorisations à plus long terme ; deuxièmement, la question de la durabilité des dépenses d'investissement des fournisseurs de services cloud à très grande échelle – Morgan Stanley souligne que la croissance des dépenses d'investissement entre 2025 et 2026 dépasse de loin la croissance réelle des revenus, ce qui exerce une pression sur les flux de trésorerie ; troisièmement, les perturbations géopolitiques et les contrôles à l'exportation affectant la chaîne d'approvisionnement des puces de pointe.

BTC-1,00%
ETH0,46%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé