Interview du PDG de Micron : « La « mémoire » est le goulot d'étranglement négligé de l'IA, la tension d'approvisionnement pourrait se prolonger jusqu'après 2026 »

robot
Création du résumé en cours

Auteur original : Li Jia

Source originale : Wall Street Journal

« La compétition en IA n’est pas seulement une course de puissance de calcul, mais aussi une compétition de stockage. » Le PDG de Micron, Sanjay Mehrotra, a donné cette appréciation.

Lors du podcast « A Bit Personal » du 5 juin, Sanjay a accepté une interview rare en profondeur enregistrée chez lui. En plus des insights habituels sur l’industrie, cette conversation à caractère personnel l’a amené à parler volontairement de son parcours, de l’influence familiale et des choix de carrière.

L’IA est encore à ses touts débuts, c’est l’un des jugements fondamentaux de Sanjay.

Selon lui, avec l’évolution continue des grands modèles, des agents IA et des applications de raisonnement, l’IA nécessite non seulement une puissance de calcul accrue, mais aussi une « capacité de mémoire » renforcée.

Une fenêtre de contexte plus longue, une échelle de modèle plus grande et une consommation de tokens en constante augmentation stimulent la demande de stockage.

L’essence de l’IA est les données, et les données ne peuvent exister sans stockage, donc le stockage deviendra l’une des infrastructures fondamentales pour améliorer les capacités de l’IA.

Par ailleurs, l’offre n’est pas encore prête. Sanjay souligne que le secteur du stockage fait face non pas à un déséquilibre à court terme, mais à des contraintes structurelles. Les produits de stockage avancés nécessitent plus de wafers, et la construction de nouvelles usines de wafers prend souvent trois à quatre ans, avec une montée en capacité également longue.

Plus important encore, avec l’avancement des nœuds technologiques, le rendement en capacité de stockage par wafer diminue. Il estime que la tension d’approvisionnement pourrait durer jusqu’après 2026.

Pour expliquer pourquoi la technologie de stockage a été sous-estimée longtemps, Sanjay déclare franchement : « Les gens ont souvent une mauvaise compréhension de la mémoire, ils ne savent pas à quel point il est difficile de la fabriquer. » De la physique, de la chimie, des sciences des matériaux, jusqu’à la production de masse pour assurer que chaque trillion de bits fonctionne correctement, la difficulté technique est très élevée. Il pense que la compétition en IA est aussi une compétition de stockage, un aspect longtemps ignoré par le marché.

D’un point de vue plus long terme, Sanjay pense que la logique fondamentale du succès des entreprises et des individus n’a pas changé. Qu’il s’agisse de piloter un plan d’investissement de 200 milliards de dollars ou de guider Micron à travers le cycle du secteur du stockage, les mots-clés qu’il répète sont résilience, discipline et long-termisme. Les investissements doivent reposer sur les données et les fondamentaux, les leaders doivent comprendre les tendances industrielles tout en maîtrisant les détails techniques.

Comme il l’a appris de son père, le succès nécessite à la fois la persévérance et la capacité à saisir les opportunités au bon moment.

Les points clés de l’interview du PDG de Micron, Sanjay Mehrotra :

Le stockage est le goulet d’étranglement sous-estimé de l’IA, sa difficulté de fabrication et sa valeur stratégique dépassent largement la perception du marché. L’IA évolue d’une « course de puissance » à une « course de stockage ». L’augmentation de la taille des modèles, l’allongement des fenêtres de contexte, la croissance de la consommation de tokens font que l’IA dépend non seulement d’une puissance de calcul plus forte, mais aussi d’une « capacité de mémoire » renforcée. Sans capacité de stockage suffisante et bande passante, même la puissance la plus forte ne peut s’exprimer.

Les contraintes structurelles de l’offre déterminent que la pénurie de stockage n’est pas une fluctuation à court terme, mais un état à long terme. Les produits de stockage avancés consomment plus de wafers, et la construction de nouvelles usines de wafers prend trois à quatre ans, avec une montée en capacité également longue. Par ailleurs, l’avancement des nœuds technologiques réduit le rendement en capacité par wafer. En raison de cette inadéquation entre offre et demande, la tension pourrait durer jusqu’après 2026.

On sous-estime toujours la difficulté de fabriquer de la mémoire, mais c’est précisément la barrière la plus profonde du secteur. De la physique à la chimie, en passant par les sciences des matériaux, assurer la bon fonctionnement de chaque trillion de bits en production de masse est une tâche d’ingénierie extrêmement complexe. La difficulté de fabrication des puces de stockage n’est pas moindre que dans tout autre domaine des semi-conducteurs, voire plus difficile dans certains aspects.

Le succès repose sur la résilience, la discipline et le long-termisme, pas sur des jugements à court terme. Qu’il s’agisse de piloter un investissement de 200 milliards de dollars ou de traverser les cycles du secteur du stockage, les leaders doivent comprendre les tendances industrielles tout en maîtrisant les détails techniques. Comme son père qui n’a pas abandonné après trois refus de visa, le succès exige à la fois de la ténacité et la capacité à saisir les opportunités clés.

Le stockage devient l’épine dorsale de l’IA

En évoquant la position historique actuelle du secteur du stockage, Sanjay déclare franchement : « Je suis dans cette industrie depuis plus de 45 ans. C’est le moment le plus excitant que j’ai vécu dans toute ma carrière. »

Il explique plus en détail la signification stratégique du stockage pour l’IA :

« Sans semiconducteurs, il n’y aurait pas d’IA. Et le stockage est le pilier de l’IA, la base clé qui soutient l’évolution continue de l’IA. »

Selon lui, le rôle du stockage ne se limite plus à une pièce dans un appareil, il supporte directement « l’intelligence » elle-même : « Aujourd’hui, le stockage ne sert pas seulement à faire fonctionner l’appareil, il soutient l’« intelligence » de l’IA, aidant l’intelligence artificielle à devenir plus intelligente. »

Avec l’expansion des modèles, la croissance des besoins en inférence et l’émergence rapide de l’agent IA, la logique de la demande en stockage est très claire pour Sanjay : « Avec des modèles de plus en plus grands, une demande d’inférence en forte croissance, l’IA passant de l’entraînement à l’inférence, du centre de données à l’edge, la demande en stockage ne fera que croître — elle nécessite plus de capacité, de performance, et de faible consommation. »

Il mentionne aussi l’importance de l’économie des tokens dans la dépendance au stockage : « Quand on regarde l’économie des tokens, elle dépend aussi fortement du stockage. Avec l’augmentation de l’utilisation des tokens, la fenêtre de contexte devient plus longue, la demande de cache KV augmente, et le modèle lui-même devient plus grand, l’IA a besoin non seulement de puissance de calcul, mais aussi de la capacité à « se souvenir ».

La tension d’approvisionnement perdurera après 2026

Concernant la question cruciale de l’offre et de la demande, Sanjay donne une réponse claire : la tension dans l’offre du secteur durera jusqu’après 2026, et ce, pendant une période assez longue.

Il explique les contraintes structurelles de l’offre : « Construire une usine de wafers prend beaucoup de temps. Du début des travaux à la première production, il faut généralement trois à quatre ans. Ensuite, il faut continuer à augmenter la capacité, étape par étape. »

Plus important encore, l’augmentation de la difficulté technologique réduit le rendement en capacité par wafer : « Chaque nouvelle génération de technologie apporte une amélioration de l’efficacité de production, c’est-à-dire la quantité de bits par wafer, qui diminue. »

Sanjay révèle que Micron avait anticipé cette tendance dès 2021.

À cette époque, la part du stockage à haute bande passante (HBM) dans l’industrie était inférieure à 1 %, mais ils avaient déjà prévu que plusieurs générations de HBM consommeraient beaucoup de silicium, bouleversant la configuration de l’offre : « C’est pourquoi, dès 2021, nous avons dit que le secteur aurait besoin de nouvelles usines de wafers à partir de zéro. Personne ne prévoyait que l’IA exploserait si rapidement. »

Concernant la crainte d’un « surapprovisionnement » après une période de pénurie, Sanjay ne l’exclut pas totalement, mais insiste sur le fait que l’IA est encore à ses débuts, et que la croissance structurelle à long terme de la demande est la base de sa confiance : « Sur le plan de la demande, tout cela en est encore à ses touts débuts. Nous pensons que l’IA a encore un long chemin à parcourir. »

La logique sous-jacente à l’investissement de 200 milliards de dollars : la discipline

L’annonce de Micron d’investir 200 milliards de dollars aux États-Unis pour construire un écosystème de fabrication de stockage est l’une des décisions de capital les plus remarquables dans l’industrie des semi-conducteurs ces dernières années. Sur cette décision, Sanjay insiste à plusieurs reprises sur le mot « discipline » :

« L’investissement n’est pas fait à l’aveugle, il doit être discipliné et basé sur des données. Il faut comprendre la technologie, comprendre l’application, et savoir où ces applications vont évoluer. Il faut aussi collaborer étroitement avec les clients, comprendre leurs futurs besoins, et quel rôle Micron y jouera. »

Il explique aussi la discipline dans l’exécution : « Aujourd’hui, nous investissons dans la construction de plusieurs nouvelles usines de wafers à partir de zéro. La première étape consiste à construire les bâtiments et les infrastructures. Une fois ces usines terminées, lors de l’installation des équipements et de la mise en production, nous maintenons la discipline — évaluer en permanence les prévisions de demande, les progrès technologiques, et comment la demande de produits va évoluer. »

Interrogé sur d’éventuels doutes personnels, Sanjay répond sans détour :

« Nous n’avons pas de doute. Nous croyons fermement au potentiel du stockage, cela est aujourd’hui très clair. Bien sûr, dans notre activité, il est toujours important de rester adaptable et agile. »

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé