55TB devient 28TB ? La rumeur et la panique derrière la réduction de moitié de la mémoire Rubin

Question

Écriture : Étude sur la tendanceLe 4 juin au petit matin, l'institut de recherche indépendant le plus influent dans le secteur des semi-conducteurs, SemiAnalysis, a publié une chronique matinale.L'information clé se résume à une seule phrase : la capacité de DRAM SOCAMM par rack du Vera Rubin NVL72 d'Nvidia pourrait passer d'environ 55TB à environ 28TB, contrairement aux prévisions précédentes d'environ 55TB. La majorité des systèmes Rubin utiliseront des modules SOCAMM de 96GB, plutôt que les 192GB attendus généralement sur le marché.Après la diffusion de cette nouvelle, la réaction du marché a été simple et brutale : la demande de mémoire est réduite de moitié, ce qui est défavorable à Micron. MU a brièvement chuté de plus de 10 % en cours de séance, passant de son record historique de 1089 dollars la veille à 971 dollars, évaporant plus de 100 milliards de dollars de capitalisation en une seule journée.La panique est réelle, mais la question est : la direction de cette panique est-elle correcte ?Commençons par faire les comptesVera Rubin NVL72 est le rack de supercalcul AI de nouvelle génération d'Nvidia. Chaque rack contient 72 GPU Rubin et 36 CPU Vera. Sur le plan GPU, c’est du HBM4, 288GB par GPU, pour environ 20,7TB par rack, cette partie ne change pas. La différence concerne la partie CPU.Chaque CPU Vera dispose de 8 emplacements SOCAMM, chacun pouvant accueillir des modules de différentes capacités. La spécification officielle annoncée par Nvidia lors du CES 2026 indique que « chaque CPU Vera supporte jusqu’à 1,5TB de LPDDR5X », ce qui correspond à une configuration avec 8 modules de 192GB chacun. Avec 36 CPU, cela donne 54TB.SemiAnalysis indique cette fois que la configuration réelle d’expédition ne sera probablement pas remplie à capacité maximale. La majorité des systèmes utiliseront des modules de 96GB, soit 8×96GB=768GB par CPU, ce qui donne environ 28TB pour 36 CPU.Passant de 55TB à 28TB, la capacité diminue presque de moitié, et le titre sensationnaliste parle d’une « réduction de moitié de la demande de mémoire ».Mais ce calcul, le marché s’est trompé sur une variable clé.La faille dans la logique de la paniquePremièrement, SOCAMM est un design à emplacements modulaires, pas une mémoire soudée en permanence.C’est le détail technique le plus facilement négligé dans toute cette histoire. Contrairement au LPDDR soudé sur la carte mère du GB300 Blackwell Ultra, la plateforme Vera Rubin utilise des modules SOCAMM2 standardisés selon JEDEC, qui sont amovibles, remplaçables à chaud, et peuvent être mis à jour ultérieurement. Aujourd’hui, on insère du 96GB, demain, si le client en a besoin, on peut retirer et mettre du 192GB ou même 256GB, aussi simplement que de changer une barrette de RAM.Nvidia a souligné ce design lors du CES 2026 : le temps d’assemblage d’un plateau de calcul est passé de 2 heures à 5 minutes grâce à cette modularité. La conception modulaire, facile à maintenir et à faire évoluer, constitue l’une des plus grandes avancées architecturales du Vera Rubin par rapport au Blackwell.Réduire la configuration initiale d’expédition ne signifie pas que la demande permanente disparaît. C’est plutôt une stratégie de « monter à bord d’abord, payer plus tard ».Deuxièmement, la raison de la réduction de capacité n’est pas un manque de besoin, mais une insuffisance.Dylan Patel, fondateur de SemiAnalysis, a dit une phrase significative sur Twitter : « J’aime une chose, c’est que ceux qui partagent notre rapport en oublient la majorité du contenu. Cela arrive souvent. »Les commentaires des lecteurs sur Digg à propos de cette nouvelle sont également très révélateurs : 77,8 % pensent que la diffusion secondaire est une manipulation de titre hors contexte.Ce qui est omis ? Le contexte.En 2026, l’offre mondiale de LPDDR5X est extrêmement tendue. Micron a clairement indiqué lors de la conférence Wolfe fin mai que la demande en mémoire dépasse nettement la capacité d’offre, et cette situation devrait durer au-delà de 2026. Micron a déjà vendu tout son volume de production HBM4 pour l’année fiscale 2026, avec une augmentation de plus de 110 % du prix moyen du DRAM par rapport à l’année précédente, et une marge brute atteignant 74 %. Samsung et SK Hynix sont également à pleine capacité et en pleine vente.Dans ce contexte, le problème d'Nvidia n’est pas que ses clients ne veulent pas plus de mémoire, mais qu’ils ne peuvent pas obtenir suffisamment de puces LPDDR5X pour remplir chaque emplacement.Réduire la configuration SOCAMM par rack est essentiellement une gestion de la chaîne d’approvisionnement à un niveau d’ingénierie : plutôt que de retarder la livraison du rack entier à cause de pénuries de mémoire, il vaut mieux expédier avec une configuration inférieure pour mettre rapidement en service la puissance de calcul.Ce n’est pas un signe de contraction de la demande, bien au contraire, c’est un signal que l’offre ne peut suivre la demande.Troisièmement, moins de mémoire ne signifie pas moins de racks.Le marché a fait une simple multiplication : mémoire réduite de moitié par rack → demande totale réduite de moitié. Mais il y a un autre facteur : le volume d’expédition.Si la capacité SOCAMM par rack passe de 55TB à 28TB, sous la même contrainte d’approvisionnement en LPDDR5X, Nvidia peut en fait assembler plus de racks. Une même quantité de mémoire suffisait auparavant pour 100 racks, elle suffit maintenant pour près de 200 racks.La consommation totale de LPDDR5X n’a pas diminué, elle a simplement été répartie sur plus de racks. Pour Nvidia, c’est une décision pragmatique pour accélérer la mise sur le marché du Rubin ; pour les fabricants de mémoire, cela ne signifie pas nécessairement une baisse des commandes totales.De plus, la demande en mémoire CPU est très élastique. Toutes les charges de travail ne nécessitent pas 1,5TB de LPDDR5X. La formation de grands modèles consomme effectivement beaucoup de mémoire, mais pour de nombreux cas d’inférence, notamment l’IA agentique et la gestion de longues sessions de contexte, le cache KV peut être déplacé de manière flexible entre HBM et LPDDR via NVLink-C2C. Pour beaucoup de clients, 768GB de mémoire côté CPU est déjà suffisant.Alors pourquoi Micron a-t-il encore chuté de 10 % ?Parce que SemiAnalysis n’est que la deuxième paille qui a fait plier le chameau.La première est Broadcom. Avant l’ouverture des marchés américains le 4 juin, Broadcom a publié ses résultats du Q2. Les chiffres eux-mêmes ne sont pas mauvais : 22,19 milliards de dollars de revenus, en hausse de 48 %, un EPS non-GAAP de 2,44 dollars supérieur aux attentes. Mais le PDG, Chen Fuyang, n’a pas relevé la prévision annuelle de revenus pour les puces AI à 100 milliards de dollars, ce qui a été perçu comme insuffisant. Le titre Broadcom a chuté de 15 %, entraînant une baisse collective du secteur des semi-conducteurs.Le jour même, Micron n’a pas publié de mauvaises nouvelles spécifiques. TipRanks, Motley Fool, 24/7 Wall St. et d’autres médias ont tous souligné qu’il s’agissait d’une chute en cascade, liée à la réaction du marché. En tant que fournisseur clé de la chaîne de mémoire AI, et fortement liée à l’optimisme autour des dépenses en IA, la prévision de Broadcom a fait réévaluer la croissance attendue de toute la filière des puces AI.Le rapport de SemiAnalysis s’est répandu le même jour, fournissant aux traders en quête de raisons de vendre une narration parfaite : ce n’est pas seulement un affaiblissement général de l’enthousiasme pour l’IA, mais aussi une réduction concrète des chiffres de la demande mémoire.Une action valant un billion de dollars, ayant augmenté de 900 % en un an et ayant atteint un record la veille, voit ses titres reculer de 10 %. À ce niveau, toute nouvelle négative devient un catalyseur pour prendre ses profits. La panique n’a pas besoin d’être justifiée, elle a juste besoin d’un prétexte.Interprétation de la tendanceTrois jugements.Premier, le rapport de SemiAnalysis est précis en soi, mais l’interprétation du marché est erronée. La configuration SOCAMM par défaut du Rubin NVL72 est très probablement inférieure à la valeur maximale théorique, ce qui est dû à la réalité de la chaîne d’approvisionnement et à la flexibilité de la demande. Mais « configuration par défaut inférieure » et « demande mémoire en baisse » sont séparés par une architecture modulaire à emplacements amovibles, et par une réalité industrielle où la demande dépasse largement l’offre.Deuxièmement, le principal risque pour Micron ne concerne pas SOCAMM, mais le HBM4. SemiAnalysis avait déjà rapporté en février que, dans la plateforme Rubin d'Nvidia, la part de marché de Micron pour le HBM4 était nulle, celle de SK Hynix atteignait 70 %, et Samsung 30 %. Bien que Micron ait annoncé en mars la production et la livraison du HBM4, sa part de marché est estimée à seulement 18 %. En revanche, la position de Micron dans le domaine SOCAMM est très solide : premier à lancer un SOCAMM2 de 256GB, et partenaire principal d'Nvidia dans cette technologie depuis cinq ans. La réduction de la configuration SOCAMM a un impact bien moindre sur Micron que la marginalisation du HBM4.Troisièmement, la baisse de valeur de cette action, qui a atteint un sommet historique après avoir gagné 900 % en un an, est une prise de bénéfices après une hausse. Deux catalyseurs, Broadcom et SemiAnalysis, ont amplifié cette correction. La combinaison des deux a provoqué le recul de cette action, qui a connu une hausse de 9 fois en 12 mois, de 10 %. Sur le plan commercial, cela ne s’appelle pas une « panique », mais une « correction normale ».Dylan Patel a raison : la majorité de ceux qui ont partagé son rapport ont en réalité omis la partie la plus importante du message.Ce qui est dangereux dans l’investissement dans les semi-conducteurs, ce n’est pas de se tromper de direction, mais de voir le bon titre, tout en calculant la mauvaise formule.

55TB devient 28TB ? La rumeur et la panique derrière la réduction de moitié de la mémoire Rubin

Sujets populaires

ShareYourUSStocksWinNvidia

PredictNBAChampionWin20000U

IsraelStrikesIranBTCPlunges

BitcoinETFSees7272BTCOutflow

SpaceXRoadshowHighlightsAsteroidMining

Épinglé