Le ajustement du secteur du stockage, est-ce une erreur de jugement ou un effondrement logique ?

Question

Cette semaine, une nouvelle technologie de Google a directement secoué le secteur du stockage. Prenons Micron Technology comme exemple, qui a enregistré cinq séances de baisse consécutives, et les titres liés dans le marché A ont également subi des ajustements.

TurboQuant, cette solution de compression qui prétend réduire par six les besoins en stockage KV Cache et augmenter la vitesse d’inférence par huit, a vu les actions de stockage plonger collectivement après son annonce, et beaucoup ont crié que “la demande de stockage AI allait disparaître”.

Mais si vous y réfléchissez, n’est-ce pas un peu familier ? Lorsque la technologie GQA a été lancée en 2023, certaines personnes ont également déclaré que la demande de cache KV allait être réduite de moitié et que le stockage allait s’effondrer ; lorsque PagedAttention est arrivé en 2024, les mêmes arguments ont de nouveau été avancés.

Et le résultat ? Au cours des deux dernières années, la consommation de tokens des grands modèles mondiaux a directement augmenté d’au moins dix fois, et la demande de stockage a en fait explosé.

01 La vérité sur TurboQuant : la compression n’est pas forcément une mauvaise nouvelle

Beaucoup de gens pensent qu’avec une compression de six fois, la demande de stockage ne sera pas réduite de six fois ? Cela ne signifierait-il pas la fin pour les fabricants de stockage ?

Si vous pensez ainsi, vous avez inversé la logique de cette technologie.

En termes simples, le cache KV est ce qui permet aux grands modèles de mémoire de conserver le contenu des dialogues précédents pendant l’inférence, sinon ils oublient ce que vous avez dit auparavant, et cela représente la majorité de la demande en stockage pendant l’inférence. La compression réalisée par TurboQuant vise à résoudre le principal goulot d’étranglement de l’inférence AI : le mur de mémoire.

Actuellement, le contexte des grands modèles est passé de 4K à 128K, voire à des millions de requêtes d’inférence simultanées de plus en plus nombreuses. Sans compression, même si l’on empile toute la HBM disponible, cela ne suffira pas. De plus, le coût de transport des données est bien plus élevé que le coût de calcul, ce qui ralentit considérablement la vitesse d’inférence.

Ainsi, la compression est destinée à permettre aux inférences avec de longs contextes et une forte simultanéité de fonctionner, et non à réduire l’utilisation du stockage.

Et ce n’est pas une nouveauté. L’industrie a déjà commencé son évolution.

Le GQA de 2023 a compressé le cache KV de 4 à 8 fois ; en 2024, la quantification et PagedAttention ont encore compressé de 2 à 4 fois. À chaque fois, des gens ont dit que la demande de stockage allait disparaître, et quel a été le résultat ?

Après chaque compression, les gens ont osé prendre des risques pour créer des contextes plus longs et traiter plus de requêtes simultanées. Ce qui auparavant était inabordable pour l’inférence de longs textes est maintenant réalisable, et la nouvelle demande a en fait rempli l’espace libéré par la compression, voire a nécessité davantage.

C’est ce qu’on appelle l’effet de Jevons en économie, le meilleur exemple étant la compression vidéo : lorsque H.264 et H.265 ont été introduits, la demande de stockage par unité vidéo a chuté de plus de moitié, mais les gens ont alors commencé à produire des vidéos haute définition 4K et 8K. Même maintenant, une vidéo de dix minutes peut facilement dépasser 10 Go, et à la fin, la demande totale de stockage vidéo a augmenté de dizaines de fois.

TurboQuant suit le même raisonnement. Une compression de six fois semble importante, mais regardez la croissance actuelle de la demande : en février 2026, la consommation de tokens des grands modèles mondiaux est dix fois supérieure à celle de l’année précédente, et d’ici 2028, la quantité de données mondiale devrait atteindre 394 ZB, soit plus de cinq fois celle de 2020. Cette compression est insignifiante face à une demande en croissance exponentielle.

De plus, la réduction des coûts due à la compression libérera de nouvelles demandes.

Auparavant, l’inférence avec de longs contextes était trop coûteuse, et de nombreuses entreprises ne pouvaient pas se le permettre. Maintenant que les coûts ont diminué, elles osent l’utiliser, et les fournisseurs de cloud peuvent également assouplir les restrictions de contexte et de simultanéité. Au final, la demande totale en stockage sera encore amplifiée.

En d’autres termes, TurboQuant est une optimisation de l’offre, pas une disparition de la demande. C’est une optimisation réalisée pour atténuer le mur de mémoire dans un contexte d’offre de HBM insuffisante.

À court terme, le déficit entre l’offre et la demande de HBM reste présent, et même en raison de la libération de nouvelles demandes, ce déficit pourrait se creuser.

02 Un cycle de prospérité à long terme, heurté par un cygne noir géopolitique

En fait, avant la fluctuation de TurboQuant, l’industrie du stockage était déjà entrée dans un cycle de prospérité extrême, avec un équilibre tendu entre l’offre et la demande atteint à son paroxysme.

Du côté de la demande, l’explosion de l’IA a porté la demande de stockage à des niveaux sans précédent.

Auparavant, la demande de stockage dépendait des PC et des smartphones, mais maintenant, les serveurs AI et les applications multimodales sont devenus le nouveau moteur.

La Seedance 2.0 de ByteDance consomme des tokens pour une vidéo de dix minutes qui est des dizaines de fois supérieure à celle du texte, et la nouvelle architecture de Nvidia a porté la demande en NAND de TB à PB, augmentant directement la capacité d’un seul armoire de cinq fois.

Les géants de l’internet mondial mettent en œuvre d’énormes investissements dans l’infrastructure de calcul. En 2026, les dépenses en capital des huit principaux CSP devraient augmenter de 25 %, atteignant 500 milliards de dollars, dont la majeure partie est consacrée aux infrastructures AI, le stockage étant l’un des besoins essentiels.

Du côté de l’offre, les trois grands fabricants de stockage étrangers, Samsung, SK Hynix et Micron, ont déjà restreint leurs capacités de production.

Après avoir subi des pertes lors du cycle précédent, ils sont désormais très prudents dans leur expansion et concentrent toute nouvelle capacité sur des produits haut de gamme à forte marge comme la HBM et la DDR5, tandis que la capacité de DRAM et de NAND de bas niveau est en train de se réduire.

Pire encore, la capacité de HBM haut de gamme ne peut tout simplement pas être augmentée.

Construire une salle blanche prend de 8 à 12 mois, et il faut encore plus de temps pour atteindre des rendements acceptables.

Actuellement, les stocks des trois grands fabricants sont tombés à un niveau historiquement bas de 3 à 5 semaines, ce qui signifie qu’une fois leurs stocks écoulés, la prochaine production n’est pas encore prête, et l’offre est devenue incroyablement rigide.

Cet équilibre tendu entre l’offre et la demande a déjà fait grimper le prix du stockage depuis plusieurs mois.

Le dernier rapport financier de Micron en est la meilleure preuve : pour le deuxième trimestre de l’exercice 26, son chiffre d’affaires a atteint 23,86 milliards de dollars, en hausse de 196 % par rapport à l’année précédente, avec un bénéfice net de 14,021 milliards, en hausse de 686 %, et une marge brute d’exploitation atteignant 69 %. C’est la puissance d’un super cycle.

Et c’est justement à ce moment-là que le conflit dans le détroit d’Ormuz a mis encore plus de pression sur cette offre déjà extrêmement tendue.

Il faut savoir que la majorité de la capacité de production de stockage mondiale se trouve en Corée du Sud, où Samsung et SK Hynix représentent 70 % de la capacité DRAM mondiale, tandis que 70 % des importations de pétrole de la Corée proviennent du Moyen-Orient, presque entièrement via le détroit d’Ormuz.

Pire encore, les gaz rares nécessaires à la production de stockage, comme l’hélium, sont à 64,7 % fournis par le Qatar, et la production d’hélium au Qatar a déjà été suspendue, réduisant l’offre mondiale de 30 % ; quant au néon, la majeure partie provient d’Iran, et maintenant ces éléments sont devenus des bombes à retardement dans la chaîne d’approvisionnement.

Voici la situation actuelle de l’industrie du stockage : la logique à long terme est un cycle de demande super soutenue alimenté par l’IA, avec une offre rigide et des prix en hausse ; la logique à court terme est que le conflit géopolitique dans le détroit d’Ormuz a directement frappé au cœur de la capacité de stockage à l’étranger, rendant une offre déjà tendue encore plus serrée.

03 Qui pourra combler ce manque d’offre mondial ?

Beaucoup se demandent où se trouvent les opportunités pour le stockage national à ce moment-là. Quels segments devraient attirer notre attention ?

C’est en fait très simple, il suffit de se concentrer sur deux éléments clés : d’abord, identifier les segments les plus susceptibles d’être affectés par des interférences géopolitiques, puis repérer les leaders nationaux qui ont déjà réalisé des percées technologiques et sont prêts en capacité, car ce sont eux qui pourront combler cette soudaine demande.

Tout d’abord, il s’agit des segments liés à la HBM et à la DRAM haut de gamme.

Pensez-y, la capacité de Samsung et SK Hynix a déjà été verrouillée par Nvidia. Si leur capacité rencontre des problèmes dus à l’énergie ou aux matières premières, qui viendra combler ce manque ?

Évidemment, ce sont les fonderies de puces de stockage nationales en amont, dont la capacité est en rapide expansion et dont le rendement s’est déjà amélioré. Elles s’investissent également dans la recherche et le développement de la HBM. Si l’offre à l’étranger rencontre des problèmes, les clients pourraient accélérer la validation des produits nationaux.

Ensuite, il y a le segment intermédiaire des modules de stockage.

Des entreprises comme Jiangbolong et Baiwei Storage, qui ont déjà des canaux clients établis, peuvent, en cas de problème d’approvisionnement en wafers à l’étranger et d’augmentation des prix, s’appuyer sur la capacité nationale pour fournir des produits de stockage plus stables et moins chers.

Auparavant, tout le monde pensait que la chaîne d’approvisionnement étrangère était très stable, donc ils n’étaient pas disposés à prendre le risque de passer aux produits nationaux. Cependant, le conflit géopolitique a directement sonné l’alarme à tous : la chaîne d’approvisionnement étrangère peut-elle aussi être rompue ? Avons-nous vraiment mis tous nos œufs dans le même panier à l’étranger, avec un risque aussi élevé ?

De plus, la hausse des prix du pétrole a entraîné une flambée des coûts pour les entreprises étrangères, rendant l’avantage en termes de rapport qualité-prix des entreprises nationales encore plus évident.

En résumé, la logique à long terme pour le stockage est un cycle de demande super soutenue alimenté par l’IA et une décennie de substitution nationale ; le catalyseur à court terme est ce conflit géopolitique qui a accéléré l’ensemble du processus.

Cependant, compte tenu de l’ampleur de la hausse précédente du secteur, qui a probablement déjà pleinement intégré les attentes optimistes du marché, les investissements futurs doivent être attentifs à plusieurs risques :

Risque que le développement de l’IA soit inférieur aux attentes : la demande de stockage soutenue par l’IA pourrait diminuer si les avancées technologiques des grands modèles ne sont pas à la hauteur, ce qui pourrait entraîner une réduction des dépenses en capital pour l’IA, affectant ainsi la demande.

Risque de baisse des prix du stockage : en raison de la flambée des prix du stockage, il existe des phénomènes de spéculation et de stockage dans les canaux de distribution, et si la spéculation excessive affecte la demande en aval, un risque de baisse des prix pourrait survenir.

Risque que le progrès en R&D soit inférieur aux attentes : les entreprises de stockage doivent continuer à mettre à niveau et à innover leurs produits, et si leurs choix stratégiques sont erronés, cela pourrait entraîner des risques d’échec en R&D.

04 Conclusion

En regardant l’histoire de l’industrie mondiale du stockage, chaque conflit géopolitique a accéléré la reconfiguration de la chaîne d’approvisionnement ; chaque révolution technologique a engendré de nouveaux besoins en stockage.

À l’heure actuelle, nous nous trouvons à l’intersection de la révolution de l’IA et de la reconfiguration de la chaîne d’approvisionnement, et le stockage est le cœur de ces deux grandes vagues.

Bien sûr, tout investissement dans un secteur ne peut être entièrement lisse. L’industrie du stockage fait toujours face à des risques liés à l’évolution des politiques commerciales internationales, à l’intensification de la concurrence dans le secteur et à des itérations technologiques inférieures aux attentes, ce qui exige que nous suivions en permanence les évolutions du secteur, que nous discernions le vrai du faux et que nous identifions les entreprises réellement compétitives.

Le ajustement du secteur du stockage, est-ce une erreur de jugement ou un effondrement logique ?

01 La vérité sur TurboQuant : la compression n’est pas forcément une mauvaise nouvelle

02 Un cycle de prospérité à long terme, heurté par un cygne noir géopolitique

03 Qui pourra combler ce manque d’offre mondial ?

04 Conclusion

Sujets populaires

WinGoldBarsWithGrowthPoints

RangeTradingStrategy

IsraelStrikesIranBTCPlunges

BitcoinWeakens

FedRateHikeExpectationsResurface

Hot Gate Fun

紫薇币

ZW

get

get

ZQCJ

重拳出击

PERPY

PERPY

BRAVO

BRAVO

Épingler