Le PDG de Google DeepMind, lauréat du prix Nobel de chimie Demis Hassabis, invité chez Y Combinator, évoque les avancées clés vers l’AGI, donne des conseils aux entrepreneurs pour rester en tête, et discute de l’endroit où pourrait apparaître la prochaine grande percée scientifique.

La règle la plus pratique pour les entrepreneurs en deep tech est que, si vous lancez aujourd’hui un projet deep tech sur dix ans, vous devez intégrer l’émergence de l’AGI dans votre planification. Il a aussi révélé qu’Isomorphic Labs (une société pharmaceutique IA issue de DeepMind) aura bientôt une grande annonce.

Citations clés

Feuille de route et calendrier de l’AGI

· « Ces composants technologiques existants seront presque certainement intégrés dans l’architecture finale de l’AGI. »

· « L’apprentissage continu, le raisonnement à long terme, certains aspects de la mémoire ne sont pas encore résolus, l’AGI doit tout maîtriser. »

· « Si votre calendrier pour l’AGI est autour de 2030, comme moi, et que vous lancez un projet deep tech aujourd’hui, vous devez prévoir que l’AGI pourrait apparaître en cours de route. »

Mémoire et fenêtre de contexte

· « La fenêtre de contexte correspond à peu près à la mémoire de travail. La mémoire de travail humaine ne comporte en moyenne que sept chiffres, alors que nous disposons d’une fenêtre de contexte de millions, voire dizaines de millions de tokens. Mais le problème, c’est que nous y mettons tout, y compris des informations non importantes ou erronées, ce qui est une approche assez brutale. »

· « Si l’on veut traiter un flux vidéo en temps réel et stocker tous les tokens, un million de tokens ne suffirait qu’à environ 20 minutes. »

Les défauts du raisonnement

· « J’aime jouer aux échecs avec Gemini. Parfois, il se rend compte qu’un coup est mauvais, mais ne trouve pas mieux, il tourne en rond et finit par le jouer. Un système de raisonnement précis ne devrait pas faire ça. »

· « Il peut résoudre des problèmes de niveau médaille d’or à l’IMO, mais poser une question différemment lui fait faire des erreurs de mathématiques élémentaires. Il semble qu’il manque quelque chose dans l’introspection de sa propre réflexion. »

Agent et créativité

· « Pour atteindre l’AGI, il faut un système capable de résoudre activement des problèmes pour vous. L’agent est la voie, je pense que nous ne faisons que commencer. »

· « Je n’ai pas encore vu de jeu AAA en tête des ventes d’applications utilisant la vibe coding. Avec l’effort actuel, c’est probablement possible, mais cela ne s’est pas encore produit. Il manque quelque chose dans l’outil ou le processus. »

Distillation et petits modèles

· « Notre hypothèse est qu’un modèle Pro de pointe, publié six mois à un an, peut voir ses capacités compressées dans un modèle très petit, capable de fonctionner sur des appareils en périphérie. Nous n’avons pas encore atteint la limite théorique de densité d’information. »

Découvertes scientifiques et « test d’Einstein »

· « Parfois, je l’appelle le « test d’Einstein », c’est-à-dire : peut-on entraîner un système avec les connaissances de 1901, puis le faire déduire de manière autonome les résultats qu’Einstein a obtenus en 1905, y compris la relativité restreinte ? Si c’est possible, ces systèmes ne sont pas loin d’inventer de nouvelles choses. »

· « Résoudre un problème du Millennium Prize est déjà une grande réussite. Mais plus difficile encore, c’est de proposer une nouvelle série de problèmes du Millennium, que les meilleurs mathématiciens considèrent comme tout aussi profonds et méritant une vie de recherche. »

Conseils pour la deep tech

· « Poursuivre des problèmes difficiles ou simples revient au même, la seule différence étant la difficulté de la méthode. La vie est courte, autant concentrer ses efforts sur ce qui n’a été fait par personne d’autre. »

Chemin vers l’AGI

Gary Tan : Tu réfléchis à l’AGI depuis presque plus longtemps que tout le monde. Selon le paradigme actuel, combien de architectures finales de l’AGI penses-tu que nous possédons déjà ? Qu’est-ce qui manque fondamentalement aujourd’hui ?

Demis Hassabis : La pré-formation à grande échelle, RLHF, la chaîne de pensée, je suis convaincu qu’ils feront partie de l’architecture finale de l’AGI. Ces techniques ont déjà prouvé beaucoup de choses. Je ne peux pas imaginer qu’en deux ans, on découvrira que c’est une impasse, ça ne me paraît pas crédible. Mais il manque probablement une ou deux choses par-dessus tout : l’apprentissage continu, le raisonnement à long terme, certains aspects de la mémoire. Il reste encore des problèmes à résoudre.

L’AGI doit tout maîtriser. Peut-être que les techniques existantes, avec quelques innovations progressives, suffiront à atteindre ce niveau, mais il se peut aussi qu’il reste un ou deux points clés à franchir. Je ne pense pas qu’il y en ait plus d’un ou deux. Mon estimation est que la probabilité qu’il y ait encore des énigmes majeures est d’environ 50/50. Chez DeepMind, nous avançons sur ces deux axes.

Gary Tan : Je travaille avec beaucoup de systèmes d’agents, et ce qui me surprend le plus, c’est que la base revient toujours à la même configuration de poids. La notion d’apprentissage continu est donc très intéressante, car aujourd’hui, on fait souvent du bricolage, comme ces « cycles de rêve nocturne » par exemple.

Demis Hassabis : Exactement, ces cycles de rêve sont fascinants. Nous avons déjà réfléchi à cette question dans l’intégration de la mémoire contextuelle. Mon doctorat portait sur la façon dont l’hippocampe intègre élégamment de nouvelles connaissances dans un système de connaissances existant. Le cerveau le fait très bien.

Il réalise ce processus pendant le sommeil, notamment lors du sommeil paradoxal (REM sleep), en rejouant ses expériences importantes pour apprendre. Notre premier programme Atari, DQN (DeepMind, 2013, réseau Q profond, premier à atteindre le niveau humain sur Atari grâce à l’apprentissage par renforcement profond), maîtrisait les jeux Atari en utilisant une technique clé : la mémoire d’expérience (experience replay).

Ce que nous avons appris en neurosciences, c’est de rejouer en boucle les chemins qui ont réussi. C’était en 2013, une époque ancienne en IA, mais c’était crucial à l’époque.

Je suis d’accord avec toi, on bricole encore beaucoup. On met tout dans la fenêtre de contexte. Ça ne paraît pas optimal. Même si on construit une machine ou un cerveau biologique, en théorie, on pourrait avoir une fenêtre de contexte de millions ou dizaines de millions de tokens, et une mémoire parfaite, mais la recherche et la récupération restent coûteuses. En situation de décision immédiate, trouver l’information vraiment pertinente n’est pas simple, même si tout est stocké. Je pense qu’il y a encore beaucoup d’innovation possible dans le domaine de la mémoire.

Gary Tan : Franchement, une fenêtre de contexte de un million de tokens, c’est déjà bien plus que ce à quoi je m’attendais, et ça permet beaucoup de choses.

Demis Hassabis : Oui, pour la plupart des cas d’usage, c’est suffisant. Mais réfléchissez : la fenêtre de contexte correspond à peu près à la mémoire de travail. La mémoire de travail humaine ne comporte en moyenne que sept chiffres, alors que nous disposons d’une fenêtre de contexte de millions, voire dizaines de millions de tokens. Le problème, c’est que nous y mettons tout, y compris des informations non importantes ou erronées, ce qui est une approche assez brutale. Et si vous traitez un flux vidéo en temps réel, en enregistrant tous les tokens, un million ne suffirait qu’à environ 20 minutes. Mais si vous voulez que le système comprenne votre vie sur un ou deux mois, c’est encore très insuffisant.

Gary Tan : DeepMind a toujours misé sur l’apprentissage par renforcement et la recherche. Dans quelle mesure cette philosophie est-elle intégrée dans la construction de Gemini ? L’apprentissage par renforcement est-il encore sous-estimé ?

Demis Hassabis : Peut-être, oui. La popularité de cette approche a connu des hauts et des bas. Depuis la création de DeepMind, nous travaillons sur les systèmes d’agents. Tout le travail sur Atari et AlphaGo est essentiellement de l’apprentissage par renforcement. Ce sont des systèmes autonomes capables de fixer des objectifs, de prendre des décisions, de planifier. Au début, nous nous concentrions sur les jeux, parce que leur complexité est contrôlable, puis nous avons progressé vers des jeux plus complexes, comme AlphaGo, puis AlphaStar. Nous avons presque tout fait dans le domaine des jeux.

La question suivante est : peut-on généraliser ces modèles en modèles du monde ou en modèles de langage, et pas seulement en modèles de jeux ? Nous travaillons là-dessus depuis plusieurs années. Aujourd’hui, la façon dont les modèles de pointe pensent et raisonnent en chaîne est en gros une réintroduction de ce qu’AlphaGo a initié.

Je pense que beaucoup de nos travaux passés sont très liés à ce que nous faisons aujourd’hui. Nous réexaminons ces idées anciennes, en utilisant des échelles plus grandes, de manière plus générale, avec des techniques comme la recherche par Monte Carlo (MCTS) et d’autres méthodes d’apprentissage par renforcement. Les idées d’AlphaGo et AlphaZero sont très proches des modèles fondamentaux d’aujourd’hui, et je pense que beaucoup de progrès dans les années à venir viendront de là.

Distillation et petits modèles

Gary Tan : Aujourd’hui, pour être plus intelligent, il faut des modèles plus grands, mais la distillation progresse aussi, et les petits modèles deviennent très rapides. Vos modèles Flash sont très puissants, atteignant environ 95 % des performances des modèles de pointe, pour un coût dix fois moindre. C’est ça ?

Demis Hassabis : Je pense que c’est l’un de nos principaux atouts. Il faut d’abord construire le plus grand modèle pour atteindre la pointe. Notre avantage majeur, c’est notre capacité à distiller rapidement ces capacités dans des modèles de plus en plus petits. La distillation, c’est une technique que nous avons inventée, et que nous maîtrisons toujours. Nous avons une forte motivation commerciale pour cela. Nous sommes probablement la plus grande plateforme d’applications IA au monde.

Avec AI Overviews, AI Mode, et Gemini, chaque produit de Google, y compris Maps, YouTube, intègre Gemini ou des technologies associées. Cela concerne des milliards d’utilisateurs, et plusieurs produits comptant des centaines de millions ou milliards d’utilisateurs. Ils doivent être extrêmement rapides, efficaces, peu coûteux, avec une latence minimale. Cela nous pousse à optimiser à fond nos modèles Flash et Flash-Lite, pour qu’ils soient très performants, afin de servir au mieux nos utilisateurs.

Gary Tan : Je suis curieux de savoir jusqu’où ces petits modèles peuvent devenir intelligents. La distillation a-t-elle une limite ? Un modèle de 50 milliards ou 400 milliards de paramètres peut-il être aussi intelligent que les plus grands modèles actuels ?

Demis Hassabis : Je ne pense pas que nous ayons encore atteint une limite théorique en termes d’information, du moins personne ne le sait encore. Peut-être qu’un jour, on rencontrera un plafond en densité d’information, mais pour l’instant, notre hypothèse est qu’un modèle Pro de pointe, publié, pourra voir ses capacités compressées dans un modèle très petit, capable de fonctionner sur des appareils en périphérie, en six mois à un an.

Vous pouvez voir cela avec le modèle Gemma : notre Gemma 4, pour une même taille, est très performant. Tout cela repose sur de nombreuses techniques de distillation et d’optimisation de l’efficacité des petits modèles. Je ne vois pas de limite théorique à ce stade, et je pense que nous sommes encore très loin de cette limite.

Gary Tan : Il y a une tendance incroyable en ce moment : la quantité de travail que peuvent faire les ingénieurs en six mois est multipliée par 500 à 1000. Certains ici réalisent en quelques mois ce qu’un ingénieur de Google aurait mis un millénaire à faire dans les années 2000. Steve Yegge en a parlé.

Demis Hassabis : Je trouve ça passionnant. Les petits modèles ont de nombreuses applications. Leur coût réduit et leur rapidité apportent aussi des bénéfices. En codant ou en effectuant d’autres tâches, on peut itérer plus vite, surtout en collaboration avec ces systèmes. Même si le système n’est pas à la pointe, à 90-95 %, cela suffit largement, et la vitesse d’itération compense largement cette différence.

Un autre axe majeur est de faire tourner ces modèles sur des appareils en périphérie, non seulement pour l’efficacité, mais aussi pour la confidentialité et la sécurité. Imaginez des appareils traitant des données très personnelles, ou des robots domestiques. Vous voudriez que votre robot chez vous fasse tourner un modèle puissant localement, et n’envoie que des tâches spécifiques au cloud. Le traitement audio et vidéo en local, avec des données stockées localement, pourrait devenir la norme ultime.

Mémoire et raisonnement

Gary Tan : Revenir à la mémoire et au contexte. Les modèles sont actuellement sans état. Si l’apprentissage continu devient possible, à quoi ressemblerait l’expérience pour le développeur ? Comment guideriez-vous ces modèles ?

Demis Hassabis : C’est une question très intéressante. Le manque d’apprentissage continu est une limite majeure pour les agents actuels. Ils sont utiles pour des tâches partielles, mais ne peuvent pas s’adapter à leur environnement spécifique. C’est pourquoi ils ne peuvent pas « lancer et oublier » : ils doivent apprendre leur contexte précis. Pour une intelligence vraiment générale, ce problème doit être résolu.

Gary Tan : Où en est la recherche sur le raisonnement ? Les chaînes de pensée sont très performantes, mais ils font encore des erreurs que des étudiants en mathématiques de premier cycle ne feraient pas. Quelles améliorations prévoyez-vous ?

Demis Hassabis : Il y a encore beaucoup de place pour l’innovation dans la façon de penser. Nos méthodes restent assez rudimentaires, assez brutales. On peut améliorer en surveillant la chaîne de pensée, en intervenant en cours de réflexion. Je pense que nos systèmes, comme ceux de nos concurrents, ont tendance à trop réfléchir, à s’embourber dans des cycles.

J’aime observer Gemini jouer aux échecs. Tous les grands modèles de base sont assez faibles dans ce domaine, ce qui est intéressant.

Analyser leur trajectoire de réflexion est précieux, car les échecs sont un domaine bien compris. Je peux rapidement voir s’ils s’écartent du bon chemin, si leur raisonnement est valide. Souvent, ils envisagent un coup, réalisent qu’il est mauvais, mais ne trouvent pas mieux, et finissent par le jouer. Un système de raisonnement précis ne devrait pas faire ça.

Ce décalage énorme existe encore, mais le réparer ne demanderait probablement qu’un ou deux ajustements. C’est pour ça qu’on parle de « l’intelligence en dents de scie » : capable de résoudre des problèmes de niveau médaille d’or à l’IMO, mais commettant des erreurs élémentaires avec une reformulation différente. Il semble qu’il manque encore quelque chose dans l’introspection de leur propre pensée.

Capacité réelle des agents

Gary Tan : L’agent est un sujet vaste. Certains disent que c’est une mode, une hype. Moi, je pense que c’est juste le début. Quelles sont, selon vous, la vraie capacité et la limite de l’agent chez DeepMind, par rapport à la communication extérieure et à la perception ?

Demis Hassabis : Je suis d’accord, c’est juste le début. Pour atteindre l’AGI, il faut un système capable de résoudre activement des problèmes pour vous. C’est évident pour nous depuis le début. L’agent est la voie, je pense que nous ne faisons que commencer.

Nous explorons comment faire collaborer au mieux l’agent avec le flux de travail. Nous avons beaucoup expérimenté en interne, et beaucoup de gens ici aussi. Comment intégrer l’agent dans le processus de travail, pour qu’il ne soit pas juste un gadget, mais qu’il fasse vraiment des choses fondamentales. Nous sommes encore en phase d’expérimentation. Ce n’est que récemment, en deux ou trois mois, que nous avons commencé à identifier des scénarios vraiment précieux. La technologie est à un stade où ce n’est plus un simple prototype, mais quelque chose qui peut réellement améliorer votre temps et votre efficacité.

Je vois souvent des gens lancer une trentaine d’agents, les faire tourner pendant des dizaines d’heures, mais je ne suis pas sûr que le résultat justifie l’investissement.

Nous n’avons pas encore vu de jeu AAA en tête des ventes utilisant la vibe coding. J’ai moi-même écrit quelques démos, et beaucoup ici aussi. Je peux faire un prototype de « Theme Park » en une demi-heure, alors qu’à 17 ans, j’avais mis six mois pour le faire.

J’ai le sentiment qu’en consacrant tout un été, on pourrait créer quelque chose d’incroyable. Mais cela demande aussi de l’artisanat, de la créativité humaine, du goût. Il faut que ces qualités soient intégrées dans tout ce qu’on construit. Aucun petit n’a encore sorti un jeu à plus de 10 millions d’exemplaires, mais avec les outils actuels, c’est tout à fait possible. Il manque peut-être quelque chose dans le processus ou dans les outils. Je pense qu’en 6 à 12 mois, on verra des résultats concrets.

Gary Tan : Dans quelle mesure tout cela sera-t-il automatisé ? Je ne pense pas que ce sera entièrement automatique dès le départ. La voie probable, c’est que d’abord, on atteigne une productivité 1000 fois supérieure, puis que des applications et jeux à succès soient créés avec ces outils, et que l’automatisation complète vienne ensuite.

Demis Hassabis : Exactement, c’est ce que vous devriez voir en premier.

Gary Tan : Certains font déjà ça, mais ils ne veulent pas forcément dire combien l’agent leur a aidé.

Demis Hassabis : Peut-être. Mais je veux parler de créativité. Je prends souvent l’exemple d’AlphaGo, notamment le coup 37 de la deuxième partie. Pour moi, j’attendais ce moment depuis longtemps, et une fois qu’il est arrivé, j’ai lancé des projets comme AlphaFold. On a commencé à travailler dessus dès le lendemain de notre retour de Séoul, il y a dix ans. Je suis allé en Corée pour célébrer le dixième anniversaire d’AlphaGo.

Mais sortir simplement le coup 37 ne suffit pas. C’est impressionnant, utile, mais est-ce que ce système peut inventer le jeu de go lui-même ? Si vous lui donnez une description de haut niveau, par exemple : « un jeu qu’on peut apprendre en cinq minutes, mais qu’on ne maîtrise jamais complètement, avec une esthétique élégante, qu’on peut finir en un après-midi », le système doit revenir avec le go. Aujourd’hui, ce n’est pas le cas. Pourquoi ?

Gary Tan : Peut-être que quelqu’un dans la salle peut y parvenir.

Demis Hassabis : Si quelqu’un y parvient, ce n’est pas que le système manque de quelque chose, mais que notre façon de l’utiliser est mauvaise. Peut-être que c’est la bonne réponse. Peut-être que le système a déjà cette capacité, mais qu’il faut un créateur exceptionnel pour le piloter, lui donner cette âme de projet, en étant très fusionné avec l’outil. Si vous passez votre temps à manipuler ces outils, avec une créativité profonde, vous pourriez créer quelque chose d’incroyable.

Open source et modèles multimodaux

Gary Tan : Parlons open source. La sortie récente de Gemma permet à des modèles très puissants de fonctionner localement. Qu’en pensez-vous ? L’IA deviendra-t-elle quelque chose que l’utilisateur contrôle lui-même, plutôt que de rester principalement dans le cloud ? Cela changera-t-il qui peut construire des produits avec ces modèles ?

Demis Hassabis : Nous sommes fermement en faveur de l’open source et de la science ouverte. Par exemple, nous avons tout rendu gratuit pour AlphaFold. Nos travaux scientifiques sont toujours publiés dans des revues de premier plan. Pour Gemma, nous voulons créer des modèles de classe mondiale de taille équivalente. Actuellement, Gemma a été téléchargé environ 40 millions de fois en deux semaines et demie.

Je pense aussi qu’il est important d’avoir une infrastructure open source dans la tech occidentale. La scène open source chinoise est très forte, elle est en avance dans ce domaine, mais nous pensons que Gemma est très compétitive à taille équivalente.

Un problème pour nous, c’est que personne n’a assez de puissance de calcul pour entraîner deux modèles de pointe à taille réelle en même temps. Notre décision actuelle est d’utiliser des modèles en périphérie pour Android, lunettes, robots, etc., en faisant en sorte qu’ils soient ouverts, car une fois déployés sur un appareil, ils sont exposés. Il vaut mieux tout ouvrir. Nous avons adopté une stratégie d’ouverture unifiée à l’échelle nanométrique, ce qui a du sens stratégiquement.

Gary Tan : Avant la présentation, je vous ai montré un OS IA que j’ai construit, avec lequel je peux interagir par la voix avec Gemini. Je suis un peu nerveux de vous le présenter, mais ça a marché. Gemini a été conçu dès le départ comme un modèle multimodal. J’ai testé beaucoup de modèles, et l’interaction vocale avec capacité de compréhension contextuelle et d’appel d’outils dépasse tout ce que j’ai vu.

Demis Hassabis : Exact. Un avantage peu reconnu de Gemini, c’est que nous l’avons construit dès le départ en mode multimodal. Cela a rendu le démarrage plus difficile que pour un simple texte, mais nous croyons que cela portera ses fruits à long terme, et on commence déjà à en voir les bénéfices.

Par exemple, dans le domaine des modèles du monde, nous avons construit Genie (un modèle d’environnement interactif génératif développé par DeepMind) sur Gemini. Dans la robotique aussi, Gemini Robotics s’appuiera sur des modèles multimodaux, ce qui constituera une barrière concurrentielle. Nous utilisons aussi de plus en plus Gemini chez Waymo (filiale de Google dans la conduite autonome).

Imaginez un assistant numérique qui vous accompagne dans le monde réel, sur votre téléphone ou vos lunettes, capable de comprendre votre environnement physique. Notre système est très fort dans ce domaine. Nous continuerons à investir dans cette voie, car notre avance dans ces questions est considérable.

Gary Tan : Le coût du raisonnement diminue rapidement. Quand le raisonnement devient presque gratuit, qu’est-ce qui devient possible ? Vos axes d’optimisation changent-ils ?

Demis Hassabis : Je ne suis pas sûr que le raisonnement devienne vraiment gratuit, le paradoxe de Jevons (l’efficacité accrue augmente la consommation totale) est là. Je pense que tout le monde finira par utiliser toute la puissance de calcul disponible.

On peut imaginer des millions d’agents collaborant, ou un petit groupe d’agents réfléchissant simultanément dans plusieurs directions, puis intégrant leurs résultats. Nous expérimentons ces approches, toutes consommeront des ressources de raisonnement.

En termes d’énergie, si nous résolvons la fusion contrôlée, la supraconductivité à température ambiante, ou les batteries optimales, je pense que grâce à la science des matériaux, le coût énergétique pourrait tendre vers zéro. Mais la fabrication physique des puces reste un goulot d’étranglement, au moins pour plusieurs décennies. Donc, le quota de raisonnement restera limité, et il faudra continuer à optimiser l’utilisation.

Prochaine percée scientifique

Gary Tan : Heureusement, les petits modèles deviennent de plus en plus intelligents. Beaucoup de fondateurs dans la biotech et la biologie sont ici. AlphaFold 3 a déjà dépassé la protéine, en s’étendant à une gamme plus large de molécules biologiques. À quel stade sommes-nous pour modéliser un système cellulaire complet ? Est-ce une toute autre catégorie de difficulté ?

Demis Hassabis : Isomorphic Labs progresse très bien. AlphaFold n’est qu’une étape dans le processus de découverte de médicaments. Nous travaillons aussi sur la recherche en biochimie, la conception de composés avec les propriétés correctes, et nous aurons bientôt des annonces majeures.

Notre objectif ultime est de créer une cellule virtuelle complète, un simulateur de cellule à fonction intégrale, dont la sortie sera suffisamment proche des résultats expérimentaux pour être utile. On pourra sauter beaucoup d’étapes de recherche, générer des données synthétiques pour entraîner d’autres modèles, et prédire le comportement réel des cellules.

Je pense qu’il reste environ dix ans pour une cellule virtuelle complète. Nous commençons par le noyau cellulaire, qui est relativement autonome. La clé, c’est de pouvoir isoler une partie complexe, auto-suffisante, et de faire une approximation raisonnable de ses entrées et sorties, pour se concentrer sur ce sous-système. Le noyau cellulaire est un bon candidat.

Un autre problème, c’est le manque de données. J’ai discuté avec des scientifiques utilisant la microscopie électronique et d’autres techniques d’imagerie. Si on pouvait faire de l’imagerie en direct de cellules vivantes sans les tuer, ce serait révolutionnaire. Cela permettrait de transformer le problème en une question visuelle, que nous savons comment résoudre.

Mais, à ma connaissance, aucune technologie ne permet encore d’imager des cellules vivantes à l’échelle nanométrique sans les endommager. On peut obtenir des images statiques très détaillées, mais pas encore une visualisation dynamique en temps réel.

Il y a deux voies : hardware et collecte de données, ou développement de simulateurs plus sophistiqués pour modéliser ces systèmes dynamiques.

Gary Tan : Vous ne vous limitez pas à la biologie. En science des matériaux, en découverte de médicaments, en modélisation climatique, en mathématiques, si vous deviez classer, quels seront les domaines les plus transformés dans cinq ans ?

Demis Hassabis : Chaque domaine est passionnant, c’est pour ça que je suis dans l’IA depuis plus de 30 ans. Je crois que l’IA sera l’outil ultime pour faire progresser la science, la médecine, notre compréhension de l’univers.

Notre mission initiale s’est articulée en deux étapes : d’abord, résoudre l’intelligence, c’est-à-dire construire une AGI ; ensuite, utiliser cette AGI pour résoudre tous les autres problèmes. Mais nous avons dû reformuler, car certains nous demandaient si on voulait vraiment tout résoudre.

C’est bien notre intention. Aujourd’hui, tout le monde commence à comprendre ce que cela implique. Concrètement, je parle de résoudre ce que j’appelle les « problèmes racines » en science, ceux dont la percée débloque de nouvelles branches de découvertes. AlphaFold en est un exemple.

Plus de trois millions de chercheurs dans le monde utilisent AlphaFold. Des dirigeants de l’industrie pharmaceutique m’ont dit que presque tous les médicaments à venir utiliseront AlphaFold à un moment ou un autre dans leur processus. Nous en sommes fiers, c’est l’impact que nous espérons que l’IA aura. Mais ce n’est que le début.

Je ne vois pas de domaine scientifique ou technique où l’IA ne pourrait pas aider. Les domaines que vous mentionnez sont encore à l’état de « AlphaFold 1 », avec de belles promesses, mais sans avoir encore résolu les grands défis. Dans deux ans, nous aurons beaucoup d’avancées dans tous ces secteurs, de la science des matériaux aux mathématiques.

Gary Tan : On dirait une promesse de Prométhée, une capacité totalement nouvelle pour l’humanité.

Demis Hassabis : Exact. Mais, comme dans la légende, il faut aussi faire attention à comment cette capacité sera utilisée, à qui l’utilisera, et aux risques de mauvais usage.

Expériences de réussite

Gary Tan : Beaucoup ici essaient de créer des entreprises appliquant l’IA à la science. Selon vous, quelle différence y a-t-il entre une startup de pointe et celles qui se contentent de mettre une API sur un modèle de base, en se revendiquant « IA pour la science » ?

Demis Hassabis : Je me demande, si j’étais à votre place, comment je ferais chez Y Combinator. Il faut prévoir la direction de l’IA, ce qui est difficile. Mais je pense qu’il y a une énorme opportunité à combiner l’IA avec d’autres domaines de deep tech. Que ce soit dans les matériaux, la médecine ou d’autres sciences difficiles, surtout dans le domaine atomique, il n’y a pas de raccourci dans un avenir proche. Ces domaines ne seront pas balayés par une simple mise à jour de modèles de base. Si vous cherchez une voie défensive, c’est ce que je recommanderais.

Je suis toujours passionné par la deep tech. La vraie valeur durable ne vient pas facilement. Je suis attiré par la deep tech depuis toujours. En 2010, quand nous avons commencé, l’IA était encore une deep tech — les investisseurs me disaient « on sait que ça ne marchera pas », et la communauté académique la considérait comme une niche des années 90, vouée à l’échec.

Mais si vous croyez en votre idée — pourquoi cette fois serait différente, quelles sont vos compétences uniques ? Idéalement, vous êtes expert en machine learning et en applications, ou vous pouvez constituer une équipe fondatrice de ce niveau — alors, il y a un potentiel énorme à créer de la valeur.

Gary Tan : C’est une information précieuse. Une fois qu’un projet est réussi, cela paraît évident, mais avant, tout le monde vous disait que vous aviez tort.

Demis Hassabis : Bien sûr, il faut faire ce qui vous passionne vraiment. Pour moi, je ferai toujours de l’IA, quoi qu’il arrive. Depuis tout petit, j’ai décidé que c’était la chose la plus impactante que je pouvais faire. Et ça s’est avéré vrai, mais peut-être que je suis en avance de 50 ans.

C’est aussi ce que je trouve le plus intéressant. Même si aujourd’hui, on est encore dans un petit garage, et que l’IA n’est pas encore là, je continuerai à chercher des moyens d’avancer. Peut-être que je retournerai dans le monde académique, mais je continuerai d’une façon ou d’une autre.

Gary Tan : AlphaFold est un exemple où tu as suivi une intuition et tu as eu raison. Qu’est-ce qui rend un domaine scientifique propice à des percées comme AlphaFold ? Y a-t-il des règles, comme une fonction objectif particulière ?

Demis Hassabis : Je devrais vraiment écrire un article là-dessus. Ce que j’ai appris de AlphaGo, AlphaFold et tous ces projets, c’est que nos techniques fonctionnent le mieux quand :

Le problème possède un espace de recherche combinatoire énorme, plus il est grand, mieux c’est — au point qu’aucun algorithme de force brute ou spécifique ne peut le résoudre. La recherche de coups au go ou la configuration des protéines dépassent en nombre tous les atomes de l’univers.
La fonction objectif est claire, comme minimiser l’énergie libre d’une protéine ou gagner une partie de go. Cela permet au système d’utiliser la descente de gradient.
Il y a suffisamment de données, ou un simulateur capable de générer beaucoup de données synthétiques dans la distribution.

Si ces trois conditions sont réunies, nos méthodes actuelles peuvent aller très loin pour trouver la « aiguille dans la botte de foin ». La découverte de médicaments suit la même logique : il faut trouver une molécule qui traite une maladie sans effets secondaires, en respectant les lois physiques. AlphaFold a montré qu’on pouvait explorer efficacement ces vastes espaces de recherche.

Gary Tan : Je veux monter d’un cran. On parle de l’humain qui utilise ces méthodes pour faire AlphaFold, mais il y a aussi une dimension méta : l’humain utilise l’IA pour explorer l’espace hypothétique. À quel point sommes-nous proches d’un système capable de faire de la vraie science, pas seulement de la reconnaissance de motifs ?

Demis Hassabis : Je pense que c’est très proche. Nous travaillons sur des systèmes généralistes. Nous avons un « AI co-scientist », et des algorithmes comme AlphaEvolve, qui vont plus loin que Gemini. Tous les grands laboratoires explorent cette voie.

Mais, pour l’instant, je n’ai pas vu de découverte scientifique majeure entièrement réalisée par ces systèmes. Je pense que ça arrive bientôt. Cela pourrait être lié à la créativité, à la rupture des frontières connues. À ce niveau, ce n’est plus de la simple reconnaissance de motifs, mais de la raison par analogie. Ces systèmes ne l’ont pas encore, ou nous ne savons pas comment les utiliser correctement.

Une norme que je répète souvent en science, c’est : peuvent-ils proposer une hypothèse vraiment intéressante, pas seulement vérifier une hypothèse existante ? Vérifier une hypothèse peut aussi être une avancée majeure, comme prouver la conjecture de Riemann ou résoudre un problème du Millennium. Mais peut-être qu’on n’est qu’à quelques années de pouvoir faire ça.

Ce qui est encore plus difficile, c’est de proposer une nouvelle série de problèmes du Millennium, que les mathématiciens de haut niveau considèrent comme tout aussi profonds, et qui mériteraient une vie entière de recherche. Je pense que c’est un niveau supérieur, et qu’on ne sait pas encore comment y parvenir. Mais je ne crois pas que ce soit de la magie. Je suis convaincu que ces systèmes finiront par y arriver, peut-être avec un ou deux ajustements.

Une façon de tester cela, c’est ce que j’appelle le « test d’Einstein » : peut-on entraîner un système avec les connaissances de 1901, puis le faire déduire de façon autonome les résultats d’Einstein en 1905, y compris la relativité restreinte ? Je pense qu’il faut vraiment faire ce test, le répéter, et voir quand il sera réussi. Une fois qu’on y parvient, ces systèmes seront proches de l’invention de choses totalement nouvelles.

Conseils pour l’entrepreneuriat

Gary Tan : Dernière question. Beaucoup ici ont une forte expérience en deep tech et veulent créer des entreprises de la même envergure que vous. Vous avez parcouru la voie de la recherche vers l’AGI. Qu’est-ce que vous savez aujourd’hui, que vous aimeriez avoir su à 25 ans ?

Demis Hassabis : On a déjà évoqué une partie. La difficulté, c’est que poursuivre des problèmes difficiles ou simples revient au même, la seule différence étant la méthode. La vie est courte, il faut concentrer ses efforts sur ce qui n’a été fait par personne d’autre.

De plus, je pense que dans les années à venir, la combinaison interdisciplinaire sera plus courante. L’IA facilitera la convergence entre disciplines.

Enfin, cela dépend de votre calendrier pour l’AGI. Pour moi, c’est autour de 2030. Si vous lancez un projet deep tech aujourd’hui, cela implique un voyage d’environ dix ans. Il faut donc prévoir que l’AGI pourrait apparaître en cours de route. Qu’est-ce que cela signifie ? Ce n’est pas forcément négatif, mais il faut en tenir compte. Votre projet peut-il tirer parti de l’AGI ? Comment l’AGI interagira-t-elle avec votre projet ?

Revenons à AlphaFold et aux systèmes d’IA généralistes. Je peux envisager que Gemini, Claude ou d’autres systèmes similaires utiliseront des systèmes spécialisés comme AlphaFold comme outils, en les appelant via une API. Je ne pense pas que tout sera intégré dans un seul système monolithique.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
LABPlunges53PercentInTwoDays
3,09M Popularité
#
IsraelStrikesIranBTCPlunges
71,94K Popularité
#
WorldCupChampionPrediction
214,28K Popularité
#
USIranWarCloudsGather
3,76M Popularité
#
GUSDYieldRisesto3.8%
907,99K Popularité

Épinglé

Interview avec le fondateur de DeepMind : architecture de l'AGI, état actuel des Agents et la prochaine percée scientifique dans la décennie

Introduction éditoriale

Citations clés

Feuille de route et calendrier de l’AGI

Mémoire et fenêtre de contexte

Les défauts du raisonnement

Agent et créativité

Distillation et petits modèles

Découvertes scientifiques et « test d’Einstein »

Conseils pour la deep tech

Chemin vers l’AGI

Distillation et petits modèles

Mémoire et raisonnement

Capacité réelle des agents

Open source et modèles multimodaux

Prochaine percée scientifique

Expériences de réussite

Conseils pour l’entrepreneuriat

Sujets populaires

LABPlunges53PercentInTwoDays

IsraelStrikesIranBTCPlunges

WorldCupChampionPrediction

USIranWarCloudsGather

GUSDYieldRisesto3.8%

Épinglé