PDG d'NVIDIA 黄仁勋 publie un nouvel article signé : Le "gâteau à cinq étages" de l'IA

robot
Création du résumé en cours

L’IA est l’une des forces puissantes qui façonnent le monde d’aujourd’hui. Elle n’est pas simplement une application ingénieuse, ni un seul modèle, mais une infrastructure essentielle, tout comme l’électricité et Internet.

L’IA fonctionne sur des matériels, une énergie et une économie réels. Elle peut transformer des matières premières à grande échelle en intelligence. Chaque entreprise appliquera l’IA, chaque pays ou région développera l’IA.

Pour comprendre pourquoi l’IA évolue de cette manière, il faut raisonner à partir des principes fondamentaux et comprendre les changements fondamentaux qui ont eu lieu dans le domaine de la computation.

Du logiciel préfabriqué à l’intelligence en temps réel

Dans l’histoire du développement des technologies informatiques, les logiciels étaient généralement préfabriqués. L’humain décrivait un algorithme, l’ordinateur l’exécutait. Les données devaient être soigneusement conçues, stockées dans des tableaux, et récupérées par des requêtes précises. SQL est devenu indispensable, car le monde d’autrefois fonctionnait ainsi.

L’IA a brisé ce modèle.

Nous disposons pour la première fois d’un ordinateur capable de comprendre des informations non structurées. Il peut reconnaître des images, lire du texte, écouter des sons et en comprendre le sens. Il peut raisonner en fonction du contexte et de l’intention. Le plus important, c’est qu’il peut générer de l’intelligence en temps réel.

Chaque réponse est entièrement nouvelle. Chaque réponse dépend du contexte que vous fournissez. Il ne s’agit pas d’une instruction stockée dans un logiciel, mais d’un logiciel qui raisonne et génère de l’intelligence selon les besoins.

Puisque l’intelligence est générée en temps réel, toute l’architecture informatique sous-jacente doit être repensée.

L’IA comme infrastructure

D’un point de vue industriel, l’architecture de l’IA peut être décomposée en cinq couches.

Énergie

La couche la plus basse est l’énergie. L’intelligence générée en temps réel nécessite une alimentation électrique en temps réel. Chaque token généré résulte du flux électronique, de la gestion thermique et de la conversion d’énergie en calcul. Au niveau de cette couche, il n’y a pas d’abstraction. L’énergie est le principe fondamental de l’infrastructure de l’IA, et le facteur limitant de la quantité d’intelligence que le système peut produire.

Puces

Au-dessus de la couche d’énergie se trouvent les puces. Ces processeurs sont conçus pour convertir efficacement une grande quantité d’énergie en capacité de calcul à grande échelle. Les charges de travail de l’IA nécessitent une capacité de traitement parallèle massive, une mémoire à large bande passante et une interconnexion rapide. Les progrès dans cette couche déterminent la vitesse d’expansion de l’IA et son applicabilité.

Infrastructure

Au-dessus des puces se trouve la couche d’infrastructure. Cela inclut les terrains, l’alimentation électrique, les systèmes de refroidissement, la construction, la communication réseau, et les systèmes qui orchestrent des milliers de processeurs dans une seule machine. Ces systèmes constituent les usines d’IA. Leur conception ne vise pas simplement à stocker des informations, mais à produire de l’intelligence.

Modèles

Au-dessus de l’infrastructure se trouve la couche de modèles. Les modèles d’IA peuvent comprendre différents types d’informations : langage, biologie, chimie, physique, finance, médecine, et le monde physique lui-même. Les modèles linguistiques ne sont qu’une catégorie. Certains des travaux les plus révolutionnaires se déroulent dans les domaines de l’IA pour les protéines, la chimie, la simulation physique, la robotique et les systèmes autonomes.

Applications

La couche la plus haute est celle des applications, où la valeur économique est créée, comme les plateformes de développement de médicaments, les robots industriels, les assistants juridiques, les véhicules autonomes, etc. La voiture autonome est une manifestation concrète de l’application de l’IA. Les robots humanoïdes illustrent l’application incarnée de l’IA. La même architecture peut produire des résultats très différents.

Voici la structure en cinq couches :

Énergie → Puces → Infrastructure → Modèles → Applications.

Chaque application réussie stimule la couche inférieure, jusqu’à la source d’énergie qui la fait fonctionner.

Nous venons tout juste de commencer cette construction, avec des investissements de plusieurs milliers de milliards de dollars, mais il reste encore à construire des infrastructures valant des dizaines de milliers de milliards de dollars.

À l’échelle mondiale, nous voyons des usines de puces, des usines d’assemblage informatique et des usines d’IA en cours de construction à une échelle sans précédent. Cela devient la plus grande infrastructure jamais construite dans l’histoire de l’humanité.

Les ressources humaines nécessaires pour cette construction sont énormes. Les usines d’IA ont besoin d’électriciens, de plombiers, de soudeurs, d’ouvriers en acier, de techniciens réseau, d’installateurs et d’opérateurs. Ce sont des emplois hautement techniques et bien rémunérés, et la demande dépasse l’offre actuelle. Participer à cette révolution ne nécessite pas forcément un doctorat en informatique.

Par ailleurs, l’IA augmente la productivité dans l’ensemble de l’économie du savoir. Par exemple, en radiologie, l’IA peut aider à interpréter les images de scanner, mais la demande pour les radiologues continue de croître. Ce n’est pas contradictoire.

Le rôle du radiologue est de prendre soin des patients, et l’interprétation des images n’est qu’une partie de son travail. Lorsque l’IA prend en charge davantage de tâches routinières, les radiologues peuvent se concentrer sur le diagnostic, la communication et le soin. L’efficacité des hôpitaux s’améliorera, permettant de traiter plus de patients et d’embaucher plus de personnel.

L’augmentation de la productivité crée de la capacité, et cette capacité stimule la croissance.

Les changements de l’année passée ?

Au cours de l’année écoulée, l’IA a franchi une étape importante. La performance des modèles s’est considérablement améliorée, permettant leur déploiement à grande échelle. La capacité de raisonnement s’est renforcée, les hallucinations ont diminué, et leur application concrète a connu une forte progression. Les applications basées sur l’IA ont commencé à générer une véritable valeur économique.

Les domaines de la recherche pharmaceutique, de la logistique, du service client, du développement logiciel et de la fabrication ont montré une forte adéquation produit-marché. Ces applications exercent une influence puissante sur toutes les couches de l’architecture sous-jacente.

Les modèles open source jouent un rôle clé. La majorité des modèles dans le monde sont gratuits et ouverts. Chercheurs, startups, entreprises et même États s’appuient sur ces modèles ouverts pour participer à l’IA avancée. Lorsque ces modèles atteignent un niveau de pointe, ils ne changent pas seulement le domaine logiciel, mais activent toute la chaîne technologique.

DeepSeek-R1 en est un excellent exemple. En rendant largement accessibles des modèles de raisonnement puissants, il accélère la diffusion des applications et stimule la demande pour l’entraînement, l’infrastructure, les puces et l’énergie.

L’essentiel

Lorsque vous considérez l’IA comme une infrastructure indispensable, ses impacts deviennent évidents.

L’IA a commencé avec les grands modèles de langage Transformer. Mais sa signification va bien au-delà. C’est une révolution industrielle qui remodèle la production et la consommation d’énergie, la construction des usines, l’organisation du travail et la trajectoire de croissance économique.

Aujourd’hui, les usines d’IA sont en construction, car l’intelligence peut être générée en temps réel. Les puces sont en train d’être redessinées, car leur efficacité détermine la vitesse d’expansion de l’intelligence. L’énergie devient un élément central, car elle détermine fondamentalement la limite de la production d’intelligence. Les applications se développent rapidement, car les modèles fondamentaux ont franchi un seuil, permettant leur déploiement à grande échelle.

Chaque couche se renforce mutuellement.

C’est pourquoi l’échelle de cette construction de l’IA est si grande : elle peut toucher de nombreux secteurs et ne se limite pas à un seul pays, région ou domaine. Chaque entreprise utilisera l’IA, chaque pays développera l’IA.

Nous sommes encore au début. La majorité des infrastructures ne sont pas encore en place, la majorité de la main-d’œuvre n’est pas encore formée, et la majorité des opportunités ne sont pas encore exploitées.

Mais la direction est claire.

L’IA devient l’infrastructure du monde moderne. Et nos choix, la vitesse de construction, l’étendue de notre participation et la manière dont nous la déployons de manière responsable détermineront l’avenir de cette époque.

NVIDIA GTC aura lieu du 16 au 19 mars 2026 à San José, Californie, aux États-Unis, ainsi qu’en ligne. Rejoignez-nous pour explorer ensemble les possibilités infinies de la prochaine génération d’IA.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler