Anthropic révèle son code source puis envoie plus de 8000 demandes de retrait de copyright, la réputation de « sécurité avant tout » confrontée à sa semaine la plus embarrassante

2026-04-02 06:57:59

Auteur : Deep Tide TechFlow

Anthropic, à la suite d’une erreur de configuration lors d’une publication npm, a accidentellement rendu publics l’intégralité du code source du produit le plus rentable de la société, Claude Code. En quelques heures, environ 512 000 lignes de code TypeScript ont été mises en miroir, disséquées et réécrites en versions Python et Rust par des dizaines de milliers de développeurs, avec l’aide de l’IA. Anthropic a immédiatement adressé à GitHub une demande de retrait pour violation du droit d’auteur au titre du DMCA, affectant quelque 8 100 dépôts de code, mais, en raison d’un préjudice important causé à de nombreux projets sans rapport, la communauté a fortement réagi. Finalement, Anthropic a été contraint de retirer la grande majorité des demandes, ne conservant que le retrait concernant 1 dépôt et 96 forks. Il s’agit de la deuxième grande affaire de fuite en l’espace d’une semaine pour Anthropic ; elle ne survient que cinq jours après la fuite d’informations sur le modèle Mythos.

Anthropic, dont le cœur de marque est la « sécurité de l’IA », traverse la semaine la plus embarrassante depuis sa création.

Selon un article du Wall Street Journal du 1er avril, lors d’une mise à jour régulière du 31 mars, Anthropic, à cause d’une erreur humaine lors du processus de build, a publié le code source complet de Claude Code, avec le paquet npm. Un chercheur en sécurité, Chaofan Shou, a publié à 4 h 23 du matin (heure de la côte Est) sur la plateforme X un lien de téléchargement, et le nombre de vues du post a rapidement dépassé 21 millions. En quelques heures, le code a été mis en miroir sur GitHub et a récolté des dizaines de milliers de likes ; un développeur coréen, Sigrid Jin, a même réécrit tout le dépôt en version Python à l’aide d’outils d’IA avant l’aube. Le projet a recueilli 50 000 étoiles GitHub en deux heures, et pourrait établir le record de croissance le plus rapide de l’histoire de cette plateforme.

Un porte-parole d’Anthropic a confirmé les faits de la fuite à CNBC, en déclarant : « Il s’agit d’un problème d’empaquetage lors d’une publication dû à une erreur humaine, et non d’une vulnérabilité de sécurité. Aucune donnée client ou aucune information d’identification sensible n’a été impliquée ou exposée. »

Un élément de configuration manquant a divulgué 512 000 lignes de code central

La raison technique de la fuite n’est pas compliquée. Claude Code est construit à partir de Bun (un outil d’exécution JavaScript acquis par Anthropic fin 2025) ; par défaut, Bun génère des fichiers de débogage source map. Lors de l’envoi du paquet npm, l’équipe de publication n’a pas exclu ce fichier dans la configuration .npmignore, ce qui a permis qu’un fichier source map de 59,8 Mo soit mis en ligne avec la version Claude Code 2.1.88. Ce fichier contient l’intégralité du contenu d’environ 1 900 fichiers sources TypeScript, soit environ 512 000 lignes de code au total, lisibles, annotées, et non soumises à une quelconque obfuscation.

Le responsable de Claude Code, Boris Cherny, admet : « Notre processus de déploiement comporte quelques étapes manuelles, et une de celles-ci n’a pas été exécutée correctement. » Il ajoute que l’équipe a déjà corrigé le problème et qu’elle ajoute davantage de contrôles automatisés, tout en soulignant que ce type d’erreur pointe vers des problèmes de processus ou d’infrastructure, plutôt que vers la responsabilité d’une personne.

Ce n’est pas la première fois. En février 2025, une fuite de source map presque identique avait déjà exposé le code source d’une version précoce de Claude Code. Un même type d’incident s’est reproduit au cours des 13 derniers mois, ce qui a amené le public à remettre en question le degré de maturité opérationnelle de cette société, évaluée à environ 380 milliards de dollars et en passe de préparer son IPO.

Ce que les développeurs ont trouvé dans le code fuit

Le dépôt de code divulgué équivaut à une feuille de route produit qu’Anthropic n’avait jamais prévu de publier. D’après l’analyse de VentureBeat et de plusieurs développeurs, le code contient 44 interrupteurs de fonctionnalité (feature flag), dont plus de 20 concernent des fonctions déjà développées mais pas encore publiées.

Parmi les éléments les plus commentés, on trouve notamment : un mode de processus de surveillance autonome appelé « KAIROS », qui permet à Claude Code, lorsque l’utilisateur est inactif, de fonctionner en continu en arrière-plan comme un agent effectuant des tâches de manière autonome ; il peut réparer périodiquement des erreurs, exécuter des tâches et envoyer des notifications push à l’utilisateur ; une architecture en trois niveaux de « mémoire auto-guérissante », via un processus d’intégration de mémoire nommé « dreaming », qui fusionne en arrière-plan des observations dispersées et élimine les contradictions logiques ; et enfin un système complet de coordination multi-agents, pouvant transformer Claude Code d’un simple agent en un coordinateur capable de générer en parallèle, d’orchestrer et de gérer plusieurs agents de travail.

La découverte la plus controversée est un fichier nommé undercover.ts. D’après The Hacker News, ce fichier contient environ 90 lignes de code ; lorsque des employés d’Anthropic utilisent Claude Code pour soumettre du code à des projets open source, il injecte des instructions système, ordonnant à Claude de ne jamais révéler qu’il est une IA, et de retirer toutes les mentions Co-Authored-By. Le code indique : « Vous exécutez une mission d’infiltration dans un dépôt public/open source. Votre message de commit, le titre de votre PR et le corps de votre PR ne doivent contenir aucune information interne d’Anthropic. Ne révélez pas votre identité. »

Le code inclut également un marqueur ANTI_DISTILLATION_CC, qui injecte des définitions d’outils falsifiées dans les requêtes API, dans le but de contaminer les données d’entraînement que des concurrents pourraient intercepter. On retrouve aussi des codes internes de modèles d’Anthropic dans le code : Capybara correspond à un nouveau niveau de modèle qui n’est pas encore publié, Fennec correspond à l’Opus 4.6 existant. Ces éléments corroborent les informations du modèle Mythos divulguées par Anthropic il y a cinq jours à la suite d’une erreur de configuration liée à CMS.

Le fondateur de l’entreprise de cybersécurité Code Wall, Paul Price, a déclaré à Business Insider que cette fuite « plus qu’elle ne cause un dommage réel, elle est surtout embarrassante. La vraie valeur réside dans les poids des modèles internes, qui eux n’ont pas été divulgués. » Toutefois, il a aussi indiqué que Claude Code est « l’une des architectures d’outils d’agents les mieux conçues à l’heure actuelle ; maintenant, on peut voir comment ils résolvent ces problèmes difficiles », ce qui représente une valeur d’information évidente pour les concurrents.

8 100 dépôts frappés par erreur : le “bug” du DMCA déclenche une réaction encore plus forte

Après la diffusion du code, Anthropic a rapidement déposé auprès de GitHub une demande de retrait au titre du DMCA, en s’appuyant sur le Digital Millennium Copyright Act américain. D’après les registres publics de GitHub, cette demande a d’abord concerné environ 8 100 dépôts de code. Le problème, c’est que les dépôts retirés ne contenaient pas seulement des miroirs du code divulgué, mais aussi des forks légitimes des dépôts officiels de Claude Code publiés par Anthropic elle-même.

De nombreux développeurs ont exprimé leur colère sur X. Danila Poyarkov, un développeur, indique qu’il a reçu un avis de retrait simplement parce qu’il avait forké le dépôt public d’Anthropic. Un autre utilisateur, Daniel San, a reçu des emails GitHub indiquant que les dépôts retirés ne contenaient que des exemples de compétences et de la documentation, sans aucun lien avec le code divulgué. Un développeur a même déclaré sans détour : « Les avocats d’Anthropic viennent juste de se réveiller et ont déjà fait retirer mon dépôt. »

Face à la riposte de la communauté, Anthropic a partiellement retiré sa demande le 1er avril. D’après les enregistrements de retrait sur GitHub, Anthropic a réduit le périmètre du retrait à 1 dépôt (nirholas/claude-code) et aux 96 URLs de forks listées séparément dans la notification originale ; pour le reste, environ 8 000 dépôts, l’accès a été rétabli par GitHub.

Un porte-parole d’Anthropic, interrogé par TechCrunch, a déclaré : « Les dépôts spécifiés dans la notification appartiennent au réseau de forks relié à nos dépôts publics de Claude Code ; par conséquent, les dépôts touchés par le retrait dépassaient ce qui était attendu. Nous avons retiré toutes les notifications sauf celle concernant un seul dépôt ; GitHub a rétabli l’accès aux forks affectés. »

Le code est archivé à vie sur des plateformes décentralisées : l’efficacité du DMCA est limitée

L’action d’Anthropic en matière de droits d’auteur se heurte à un dilemme fondamental : le code s’est déjà propagé de manière irréversible.

Selon un rapport de Decrypt, la plateforme Git décentralisée Gitlabb a mis en miroir l’ensemble du code source original, avec une note affirmant que « il ne sera jamais retiré ». Le DMCA est efficace pour les plateformes centralisées (comme GitHub), car ces dernières doivent s’y conformer légalement, mais on ne peut pas exercer une juridiction sur les infrastructures décentralisées. En quelques heures seulement après la fuite, le code est déjà devenu, de fait, une publication permanente grâce à suffisamment de miroirs et à différents types d’infrastructures.

De façon encore plus ironique, le développeur coréen Sigrid Jin a utilisé un outil d’orchestration d’IA, oh-my-codex, pour réécrire l’ensemble du dépôt de TypeScript en Python, sous le nom de projet claw-code. Le fondateur de The Pragmatic Engineer, Gergely Orosz, a indiqué sur X qu’il s’agissait d’une « réécriture en chambre blanche » (clean-room rewrite) constituant une œuvre de création indépendante, et qu’en conception, elle se situe hors de portée du DMCA. Si Anthropic soutenait que le code réécrit par IA reste une atteinte au droit d’auteur, cela affaiblirait précisément la logique centrale de défense des sociétés d’IA dans les procès liés aux droits d’auteur des données d’entraînement : à savoir que les sorties générées par l’IA à partir d’entrées protégées par le droit d’auteur constituent un usage raisonnable.

Un positionnement en matière de droits d’auteur gênant : se contredire soi-même ou une nécessité juridique ?

Dans cet événement, la tension la plus suivie par la communauté réside dans la contradiction du positionnement en matière de droits d’auteur. Anthropic a été condamnée en septembre 2025 par un tribunal à verser 1,5 milliard de dollars en dommages-intérêts pour avoir entraîné Claude avec des livres piratés et une shadow library ; Reddit a poursuivi Anthropic à partir de juin 2025 pour avoir récupéré du contenu généré par les utilisateurs à des fins d’entraînement de modèles sans autorisation. Une société en proie à plusieurs poursuites pour des questions de droits d’auteur sur les données d’entraînement utilise ensuite la législation sur le droit d’auteur pour protéger son propre code : il est prévisible que la communauté réagisse.

Un commentaire très apprécié sur Slashdot résume directement cette émotion : « “Ce qu’on a publié et qui profite de quelque chose de volé, vous osez le voler !” — C’est vraiment une position. » Un autre utilisateur estime que, d’un point de vue de stratégie juridique, l’action DMCA n’est pas totalement dénuée de sens : « Si Anthropic veut poursuivre d’autres sociétés qui utilisent son code à l’avenir, et qu’ils n’ont même pas essayé de faire retirer les distributeurs, alors ce n’est pas défendable devant un tribunal. »

Ce débat touche aussi à une question juridique de pointe : la question de l’attribution du droit d’auteur du code généré par IA. D’après les divulgations publiques précédentes de Gartner et d’Anthropic, environ 90 % du code de Claude Code est généré par l’IA. En mars 2025, un tribunal fédéral américain a statué que les œuvres générées par IA ne bénéficient pas de la protection du droit d’auteur en raison du manque d’identité d’auteur humain ; la Cour suprême a refusé d’accepter un recours en mars 2026. Si la majeure partie du code de Claude Code est effectivement écrite par Claude lui-même, la revendication d’Anthropic en matière de droits d’auteur présenterait alors, sur le plan juridique, une incertitude substantielle.

Deux fuites par semaine : alarme de sécurité opérationnelle à la veille de l’IPO

La fuite du code source de cette fois ne s’est produite que cinq jours après le précédent incident de fuite d’Anthropic. Le 26 mars, le magazine Fortune a rapporté qu’Anthropic, en raison d’une erreur de configuration du système de gestion de contenu, avait exposé près de 3 000 documents internes non publiés dans un cache de données consultable publiquement, incluant des informations détaillées sur le modèle Claude Mythos qui devait être publié. Les deux incidents ont été attribués à des « erreurs humaines ».

Les chronologies de ces incidents sont sensibles. Anthropic a finalisé en février 2026 un tour de financement de série G de 30 milliards de dollars, avec une valorisation de 380 milliards de dollars, et selon des rapports, préparerait un IPO dès octobre 2026, dont le volume de financement pourrait dépasser 60 milliards de dollars. Goldman Sachs, JPMorgan Chase et Morgan Stanley auraient déjà pris contact en amont. Le chiffre d’affaires annualisé de Claude Code a dépassé 2,5 milliards de dollars, ce qui en fait l’un des moteurs de revenus les plus importants de la société. TechCrunch a souligné que, pour une entreprise en train de préparer son introduction en bourse, la fuite du code source implique presque inévitablement des poursuites intentées par des actionnaires.

Dans son analyse de l’événement, VentureBeat a soulevé une question plus incisive : en mars, Anthropic aurait eu une dizaine d’incidents, mais n’a publié qu’un seul rapport post-incident ; le système de surveillance tiers aurait détecté les pannes 15 à 30 minutes plus tôt que l’état interne affiché par Anthropic sur sa page de statut. Pour une entreprise roulant vers les marchés publics avec une valorisation de 380 milliards de dollars, l’adéquation entre sa transparence opérationnelle et sa maturité, d’une part, et cette valorisation, d’autre part, est une question que les investisseurs devront eux-mêmes trancher.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.