Le dernier article de Jensen Huang : le « gâteau à cinq couches » de l'IA

robot
Création du résumé en cours

La véritable signification de l’IA ne se limite pas à un logiciel plus intelligent, mais représente une révolution infrastructurelle d’une ampleur comparable à celle de l’électricité et d’Internet.

Article : Huang Renxun

Traduction : Peggy, BlockBeats

L’intelligence artificielle est l’une des forces les plus puissantes qui façonnent le monde aujourd’hui. Ce n’est pas une application intelligente unique, ni un seul modèle, mais une infrastructure aussi essentielle que l’électricité et Internet.

L’IA fonctionne sur du matériel réel, une énergie réelle et un système économique réel. Elle transforme les matières premières en « intelligence » à grande échelle. Chaque entreprise l’utilise, chaque pays la construit.

Pour comprendre pourquoi l’IA se déploie de cette manière, il est utile de partir des principes fondamentaux et d’examiner les changements fondamentaux qui se produisent dans le domaine du calcul.

« De logiciels préfabriqués » à « intelligence générée en temps réel »

Pendant la majeure partie de l’histoire du développement informatique, les logiciels étaient « préfabriqués ». L’humain décrivait un algorithme, puis l’ordinateur exécutait les instructions. Les données devaient être soigneusement structurées, stockées dans des tableaux, et extraites par des requêtes précises. SQL est indispensable car il permet à tout ce système de fonctionner.

Mais l’IA brise ce modèle.

Pour la première fois, nous disposons d’un ordinateur capable de comprendre des informations non structurées. Il peut voir des images, lire du texte, écouter des sons et en comprendre le sens ; il peut raisonner sur le contexte et l’intention. Plus important encore, il peut générer une intelligence en temps réel.

Chaque réponse est une nouvelle génération. Chaque réponse dépend du contexte fourni. Il ne s’agit plus d’une recherche dans une base de données pour récupérer des instructions existantes, mais d’un raisonnement en temps réel et de la génération d’intelligence à la demande.

Parce que l’intelligence est générée en temps réel, toute la pile technologique qui la soutient doit également être réinventée.

L’IA en tant qu’infrastructure

Du point de vue industriel, l’IA peut en réalité être décomposée en une structure à cinq couches.

Énergie

La couche la plus basse est l’énergie.

L’intelligence générée en temps réel nécessite une électricité générée en temps réel. Chaque token produit implique le déplacement d’électrons, la gestion de la chaleur, la conversion d’énergie en capacité de calcul.

Au-dessous de cette couche, il n’y a aucune abstraction. L’énergie est le premier principe de l’infrastructure IA, et la contrainte fondamentale qui détermine la quantité d’intelligence que le système peut produire.

Chips

Au-dessus de l’énergie se trouvent les puces. La conception de ces processeurs vise une efficacité extrême, permettant de convertir l’énergie en capacité de calcul à grande échelle.

Les charges de travail de l’IA nécessitent une puissance de calcul parallèle massive, une mémoire à large bande passante et une connectivité rapide. Les progrès dans la conception des puces déterminent la vitesse d’expansion de l’IA et la réduction des coûts de « l’intelligence ».

Infrastructure

Au-dessus des puces se trouve l’infrastructure. Cela inclut les terrains, la distribution électrique, les systèmes de refroidissement, la construction, les réseaux, et la gestion de dizaines de milliers de processeurs en une seule machine.

Ces systèmes sont essentiellement des usines à IA. Ils ne sont pas conçus pour stocker des informations, mais pour produire de l’intelligence.

Modèles

Au-dessus de l’infrastructure se trouvent les modèles. Les modèles d’IA peuvent comprendre divers types d’informations : langage, biologie, chimie, physique, finance, médecine, et le monde réel lui-même.

Les modèles linguistiques ne sont qu’une catégorie. Parmi les travaux les plus révolutionnaires en cours figurent : l’IA pour les protéines, l’IA en chimie, la simulation physique, la robotique, les systèmes autonomes.

Applications

Au sommet se trouve la couche applicative, où la véritable valeur économique est créée. Par exemple, les plateformes de découverte de médicaments, les robots industriels, les copilotes juridiques, les véhicules autonomes.

Une voiture autonome est essentiellement une « application IA portée par une machine » ; un robot humanoïde est une « application IA portée par un corps ». La technologie de base est la même, seule la forme finale diffère.

Ainsi, cette structure à cinq couches de l’IA : énergie → puces → infrastructure → modèles → applications. Chaque application réussie influence toutes les couches en dessous, jusqu’à la centrale électrique qui l’alimente.

Une infrastructure encore en phase de construction

Nous venons tout juste de commencer cette construction. Les investissements actuels ne représentent que quelques milliers de milliards de dollars, mais à l’avenir, il faudra construire des infrastructures valant des dizaines de milliers de milliards.

Partout dans le monde, nous voyons apparaître : usines de puces, usines d’ordinateurs, usines à IA.

Une échelle sans précédent est en train d’être construite. Cela devient l’un des plus grands projets d’infrastructure de l’histoire humaine.

La demande de main-d’œuvre dans l’ère de l’IA

Le volume de main-d’œuvre nécessaire pour soutenir cette construction est énorme.

Les usines à IA ont besoin de : électriciens, plombiers, installateurs de conduits, ouvriers en structures métalliques, techniciens réseau, installateurs d’équipements, personnel de maintenance.

Ce sont des postes hautement techniques, bien rémunérés, et actuellement très rares. Participer à cette transformation ne nécessite pas forcément un doctorat en informatique.

Par ailleurs, l’IA stimule également l’augmentation de la productivité dans l’économie de la connaissance. Prenons la radiologie. L’IA commence à assister dans l’interprétation des images médicales, mais la demande pour les radiologues continue de croître.

Ce n’est pas contradictoire.

Le vrai rôle du radiologue est de prendre soin des patients, et la lecture des images n’est qu’une tâche parmi d’autres. Lorsque l’IA prend en charge de plus en plus de tâches répétitives, les médecins peuvent consacrer plus de temps à l’évaluation, la communication et le traitement.

L’efficacité accrue des hôpitaux permet de soigner plus de patients, ce qui nécessite plus de personnel. La productivité crée la capacité, et la capacité stimule la croissance.

Quelles sont les nouveautés de l’année passée ?

Au cours de l’année écoulée, l’IA a franchi une étape clé.

Les modèles sont désormais suffisamment performants pour jouer un rôle réel dans des scénarios à grande échelle.

  • Amélioration significative des capacités de raisonnement
  • Réduction notable des hallucinations
  • Renforcement considérable de l’ancrage dans le monde réel

Pour la première fois, les applications basées sur l’IA commencent à générer une valeur économique tangible.

Des domaines tels que la recherche de médicaments, la logistique, le service client, le développement logiciel, la fabrication présentent déjà une correspondance claire entre produits et marché.

Ces applications tirent fortement vers le haut toute la pile technologique sous-jacente.

Le rôle des modèles open source

Les modèles open source jouent un rôle clé. La majorité des modèles d’IA dans le monde sont gratuits. Chercheurs, startups, entreprises, et même des nations entières dépendent des modèles open source pour participer à la compétition en IA avancée.

Lorsque ces modèles open source atteignent le sommet de la technologie, ils ne changent pas seulement le logiciel, mais stimulent aussi la demande pour toute la chaîne technologique.

DeepSeek‑R1 en est un exemple typique. En rendant un puissant modèle de raisonnement largement accessible, il accélère la croissance de la couche applicative, tout en augmentant la demande en puissance de calcul, infrastructure, puces et énergie.

Que cela signifie-t-il ?

En considérant l’IA comme une infrastructure, tout devient clair. L’IA a peut-être commencé avec Transformer et les grands modèles linguistiques, mais elle va bien au-delà.

C’est une révolution industrielle qui va redéfinir :

  • La production et la consommation d’énergie
  • La construction des usines
  • L’organisation du travail
  • Le mode de croissance économique

Les usines à IA sont construites parce que l’intelligence peut désormais être générée en temps réel. Les puces sont redessinées parce que l’efficacité détermine la vitesse d’expansion de l’intelligence. L’énergie devient centrale parce qu’elle détermine la quantité maximale d’intelligence que le système peut produire. Les applications explosent parce que les modèles ont enfin franchi le seuil de « disponibilité à grande échelle ».

Chaque couche renforce les autres.

C’est pourquoi cette construction est si massive, pourquoi elle impacte autant d’industries, et pourquoi elle ne se limite pas à un seul pays ou secteur.

Chaque entreprise utilisera l’IA.

Chaque pays construira l’IA.

Nous sommes encore au début.

Beaucoup d’infrastructures restent à construire, une main-d’œuvre à former, des opportunités à saisir.

Mais la direction est très claire.

L’intelligence artificielle devient une infrastructure fondamentale du monde moderne.

Et nos choix aujourd’hui — la vitesse de construction, l’étendue de la participation, la responsabilité dans le déploiement — détermineront la forme finale de cette ère.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler