Claude a écrit 80 % de son code lui-même, Anthropic appelle à « un mécanisme mondial de freinage », est-ce sérieux ?

Question

Anthropic Institut de recherche publie le 4 juin un long article intitulé « When AI Builds Itself ». Il dévoile un chiffre : d’ici mai 2026, Claude a écrit plus de 80 % du code fusionné dans la base de code des produits d’Anthropic. Avant le lancement de Claude Code début 2025, ce pourcentage était à un chiffre.

L’article appelle également à « une option pour le monde, permettant de ralentir ou de suspendre temporairement le développement de l’IA de pointe lorsque cela est nécessaire. »

L’IA s’auto-évolue

Anthropic explique dans l’article la courbe de capacité d’auto-amélioration de Claude.

En mars 2024, Claude Opus 3 peut traiter de manière autonome une tâche logicielle nécessitant environ quatre minutes pour un humain.

En mars 2025, Claude Sonnet 3.7 porte ce chiffre à quatre-vingt-dix minutes.

En mars 2026, Claude Opus 4.6 atteint douze heures.

Ce n’est pas une croissance linéaire, la période de doublement du durée de tâche est passée de sept à quatre mois.

Une enquête interne menée auprès de 130 membres de l’équipe de recherche d’Anthropic indique que la productivité multipliée par Mythos Preview est en médiane de quatre fois.

Quant à la quantification côté ingénierie, le nombre moyen de lignes de code fusionnées par ingénieur par trimestre a été multiplié par huit entre le deuxième trimestre 2024 et le deuxième trimestre 2026. La production de code est restée stable entre 2021 et 2024, puis a fortement augmenté à partir de 2025.

En avril 2026, Claude a corrigé plus de 800 erreurs API de manière autonome, réduisant la fréquence de certains types d’erreurs d’un facteur mille. Un ingénieur estime que le même travail réalisé par un humain prendrait quatre ans.

Les chiffres du côté recherche sont également impressionnants : deux chercheurs humains ont mis une semaine pour réduire de 23 % l’écart de performance sur une question de sécurité de l’IA. Le groupe de Claude a consacré 800 heures cumulées, utilisant environ 18 000 dollars de puissance de calcul, pour restaurer 97 % de cette performance.

En mai 2026, la qualité du code généré par Claude est équivalente à celle d’un ingénieur humain. Selon Anthropic, « fin 2025, le code écrit par Claude était encore inférieur à celui des humains, mais maintenant il est à égalité, et on prévoit qu’en un an, il surpassera strictement l’humain. »

La dernière fois qu’on a appelé à arrêter, c’était en 2019 avec GPT-2

En février 2019, OpenAI a publié GPT-2 en déclarant « trop dangereux, pas une publication complète ». Ce modèle comptait 1,5 milliard de paramètres et pouvait produire des paragraphes en anglais à moitié cohérents.

Sept ans plus tard, ce qui était considéré comme trop dangereux n’est plus qu’une fonctionnalité de base d’une application mobile gratuite.

Chaque fois qu’un laboratoire de pointe appelle à arrêter ou à craindre, deux choses se sont toujours révélées : premièrement, le danger est réel. Deuxièmement, ceux qui appellent à arrêter ne s’arrêtent pas vraiment.

Après la sortie de GPT-2, OpenAI a publié le modèle complet neuf mois plus tard. Google, après avoir annoncé en 2023 la nécessité d’un « arrêt responsable » de l’IA, a lancé moins d’un an plus tard Gemini Ultra.

Mais cette fois, Anthropic donne un chiffre précis : le cofondateur Jack Clark estime que la probabilité que l’IA atteigne une capacité d’auto-amélioration récursive est de 60 % d’ici la fin 2028.

La conscience après l’IPO ?

Les critiques n’ont pas été tendres : Noah Giansiracusa, professeur de mathématiques à Bentley University, déclare à Scientific American : « Je ne pense pas que ce soit sincère de la part d’Anthropic de vouloir ralentir. » Il souligne que Dario Amodei est en réalité en faveur d’une progression à toute vitesse, car « une pause est totalement impossible en pratique, zéro chance. »

De plus, le modèle est déjà en « auto-évolution », alors pourquoi s’arrêter ?

Mark Riedl, professeur à Georgia Tech, a été plus direct : toutes les grandes entreprises d’IA sautent sur le train de la « récursion auto-améliorante ».

Une lecture plus acerbe serait que si Anthropic appelle à une pause mondiale, et si cette pause réussit, cela figerait la position d’Anthropic en tête de la course. Ce serait soit une grande générosité soudaine d’une société cotée, soit une opération de relations publiques ciblée. La première option est peu probable.

Un marteau plus rapide ne décide pas lui-même ce qu’il faut clouer

Gary Marcus, professeur à NYU, critique sévèrement. Sur Substack, il écrit que cette publication d’Anthropic est une « inversion de concept » (bait and switch), mélangeant deux choses très différentes.

La première, c’est l’AGI (intelligence artificielle générale), supposant que l’IA peut faire tout ce qu’un humain peut faire de façon autonome. La seconde, c’est la réalité actuelle : l’IA comme un outil de codage très rapide et performant, multipliant la productivité des ingénieurs humains.

Marcus argue que toutes les données présentées par Anthropic concernent la deuxième catégorie. Claude a effectivement écrit 80 % du code, mais ces 80 % ont été réalisés dans un cadre où les humains fixent les objectifs, donnent des orientations, et examinent les résultats. C’est une pioche très rapide, mais la pioche ne décide pas elle-même quels clous enfoncer.

Un outil de codage plus rapide ne détruira probablement pas le monde.

Ce critique est-il fondé ? Partiellement. Les données d’Anthropic corroborent aussi cette vision : la précision de Claude dans le « choix de la prochaine étape de recherche » est passée de 51 % en novembre 2025 à 64 % en avril 2026. Une amélioration, mais 64 % signifie qu’une fois sur trois, il se trompe.

Une véritable auto-amélioration récursive ne consiste pas à écrire plus vite, mais à mieux décider « quoi coder ». La première capacité, Claude la maîtrise déjà mieux que la majorité des humains. La seconde, c’est encore un domaine où l’humain a un « avantage comparatif ».

Un employé anonyme d’Anthropic déclare : « L’avantage actuel de l’humain, c’est de voir la vue d’ensemble, de penser au-delà de la tâche immédiate. »

Mais combien de temps cette supériorité pourra-t-elle durer ?

Anthropic ne croit pas lui-même à cette possibilité

L’article présente trois scénarios pour l’avenir.

Premier scénario : stagnation. La capacité de l’IA rencontre un goulot d’étranglement, peut-être dû à des limites dans l’énergie, la puissance de calcul ou la fabrication de puces. Anthropic commente : « Nous pensons que cela est peu probable. »

Deuxième scénario : croissance continue de l’efficacité composite. Le développement de l’IA est fortement automatisé, mais l’humain guide toujours la recherche. Une entreprise de 100 personnes pourrait faire le travail d’une organisation de 10 000 à 100 000. La revue de code par des humains devient un nouveau goulot d’étranglement. Anthropic pense « que nous sommes probablement en route vers ce scénario ».

Troisième scénario : auto-amélioration récursive totale. L’IA conçoit et entraîne sa propre prochaine génération, la vitesse de progrès étant entièrement dictée par la puissance de calcul. L’humain devient superviseur, vérificateur, régulateur.

La description des risques pour ce troisième scénario par Anthropic est à lire mot à mot : « Les biais d’alignement qui apparaissent parfois dans les modèles aujourd’hui pourraient devenir plus fréquents dans un environnement d’auto-amélioration récursive, tout en étant plus difficiles à comprendre. »

Ce propos indique que, si l’on comprend que l’IA peut parfois agir contre l’intention humaine, cette divergence est visible. Mais lorsque l’IA s’améliore elle-même, ces biais se multiplient, et il devient de plus en plus difficile de comprendre où elle va dévier.

C’est peut-être la phrase la plus importante dans le contexte de l’auto-amélioration de l’IA : « plus fréquent, tout en étant plus difficile à comprendre ». L’IA pourrait-elle devenir maléfique pour l’humanité ?

Le traité sur les armes nucléaires ne fonctionne pas à l’ère de l’IA

La solution proposée par Anthropic est un « mécanisme de ralentissement global vérifiable », inspiré du Traité sur les forces nucléaires à portée intermédiaire (FNI) de la Guerre froide.

Cette analogie illustre la taille du problème : le FNI a mis près de dix ans à être négocié et signé, impliquant seulement deux pays. La vérification se fait par détection satellitaire des sites de lancement de missiles.

Former des modèles d’IA ne nécessite pas une telle infrastructure : un seul espace de bureau suffit, et les installations de puissance de calcul peuvent être distantes, presque impossibles à détecter.

Anthropic ajoute une condition clé : « Nous anticipons que, lorsque d’autres acteurs de pointe seront également en mesure de faire cela de manière vérifiable, nous ralentirons ou suspendrons temporairement. »

L’idée d’Anthropic est que si tout le monde s’arrête, ils s’arrêteront aussi. Si quelqu’un continue, ils continueront aussi. C’est un jeu de stratégie, où l’équilibre actuel est que tout le monde continue, car personne ne croit que les autres s’arrêteront.

L’instinct du capital est la circulation, il n’y a pas de capital qui s’arrête volontairement.

Questions fréquentes

Qu’est-ce que la récursion auto-améliorante (Recursive Self-Improvement) ?

C’est la capacité d’un système d’IA à concevoir et développer entièrement lui-même sa prochaine version. Les données d’Anthropic montrent que Claude a écrit 80 % de son propre code, mais il nécessite encore une orientation humaine pour la recherche et la revue. Jack Clark estime qu’il y a 60 % de chances d’atteindre cette autonomie d’ici la fin 2028.

Quelle est la motivation derrière l’appel d’Anthropic à suspendre le développement de l’IA ?

Ils proposent d’établir un « mécanisme de ralentissement vérifiable » semblable au traité nucléaire de la Guerre froide, mais sous condition que d’autres laboratoires de pointe participent aussi. Certains critiques soulignent que cette demande intervient seulement trois jours après la demande d’IPO de 965 milliards de dollars, et suspectent une stratégie plus axée sur la sécurité ou la compétition que sur la sécurité réelle.

Voir l'original

Claude a écrit 80 % de son code lui-même, Anthropic appelle à « un mécanisme mondial de freinage », est-ce sérieux ?

L’IA s’auto-évolue

La dernière fois qu’on a appelé à arrêter, c’était en 2019 avec GPT-2

La conscience après l’IPO ?

Un marteau plus rapide ne décide pas lui-même ce qu’il faut clouer

Anthropic ne croit pas lui-même à cette possibilité

Le traité sur les armes nucléaires ne fonctionne pas à l’ère de l’IA

Sujets populaires

ShareYourUSStocksWinNvidia

PredictNBAChampionWin20000U

IsraelStrikesIranBTCPlunges

BitcoinETFSees7272BTCOutflow

SpaceXRoadshowHighlightsAsteroidMining

Épinglé