Anthropic s’associe à 12 géants pour lancer le projet « Glass Wing », en utilisant le modèle Mythos, le plus puissant et non publié, pour réparer les vulnérabilités logicielles mondiales

Auteur : Anthropic

Traduction : Profond Titre TechFlow

Lecture en bref : Anthropic a publié un modèle de pointe non encore rendu public, Claude Mythos Preview, dont les capacités d’audit du code dépassent largement celles de la très grande majorité des experts humains en sécurité, et qui peut identifier de manière autonome des vulnérabilités zero-day existant depuis des décennies.

Grâce à cette capacité, Anthropic lance, avec AWS, Apple, Google, Microsoft, NVIDIA et d’autres géants de la technologie, le programme Project Glasswing. Le budget alloué est une enveloppe de crédit de 100 millions de dollars, avec pour objectif de combler les failles des logiciels critiques dans le monde entier avant que des attaquants n’obtiennent des capacités équivalentes.

Introduction

Aujourd’hui, nous annonçons Project Glasswing (programme « Glasswing »), une nouvelle initiative qui rassemble Amazon Web Services (AWS), Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan, la Linux Foundation, Microsoft, NVIDIA et Palo Alto Networks, avec pour objectif de protéger la sécurité des logiciels les plus critiques à l’échelle mondiale.

Nous lançons Project Glasswing, parce qu’un nouveau modèle de pointe entraîné par Anthropic a montré une capacité susceptible, selon nous, de remodeler le paysage de la cybersécurité. Claude Mythos Preview est un modèle de pointe généraliste, non encore publié, qui révèle une réalité impitoyable : les capacités de codage des modèles d’IA ont atteint un niveau tel que, pour ce qui est de découvrir et d’exploiter des vulnérabilités logicielles, ils peuvent surpasser tout le monde, à l’exception des tout meilleurs experts.

Mythos Preview a déjà identifié des milliers de vulnérabilités à haut risque, couvrant chaque système d’exploitation majeur et chaque navigateur majeur. À la vitesse des progrès de l’IA, cette capacité va se diffuser dans un avenir proche, et pourrait tomber entre les mains d’utilisateurs irresponsables. L’impact sur l’économie, la sécurité publique et la sécurité nationale pourrait être très grave. Project Glasswing est une tentative urgente visant à s’assurer que ces capacités sont d’abord utilisées à des fins de défense.

Dans le cadre de Project Glasswing, les partenaires mentionnés ci-dessus utiliseront Mythos Preview dans leurs travaux de sécurité défensive ; Anthropic partagera les enseignements tirés afin que l’ensemble de l’industrie en bénéficie. Nous ouvrons également l’accès à plus de 40 autres organisations qui construisent ou maintiennent des infrastructures logicielles critiques, afin qu’elles puissent analyser et renforcer leurs propres systèmes et leurs systèmes open source. Pour cela, Anthropic s’engage à investir jusqu’à 100 millions de dollars dans des quotas d’utilisation de Mythos Preview, ainsi qu’à faire un don direct de 4 millions de dollars à des organisations de sécurité open source.

Project Glasswing n’est qu’un point de départ. Aucune institution ne peut résoudre seule le problème de la cybersécurité : les développeurs d’IA de pointe, les autres sociétés de logiciels, les chercheurs en sécurité, les mainteneurs open source et les gouvernements du monde entier ont tous des rôles irremplaçables. Protéger l’infrastructure réseau mondiale pourrait nécessiter des années ; en revanche, les capacités d’IA de pointe pourraient faire un bond considérable dans les prochains mois. Pour que les défenseurs du réseau prennent de l’avance, ils doivent agir dès maintenant.

Cybersécurité à l’ère de l’IA

Les logiciels sur lesquels nous comptons chaque jour — pour faire fonctionner les systèmes bancaires, stocker des dossiers médicaux, connecter les réseaux de logistique, et maintenir l’approvisionnement et le fonctionnement du réseau électrique — ont toujours eu des bugs. La plupart sont sans conséquence, mais certains constituent de graves failles de sécurité : une fois découvertes, les attaquants peuvent compromettre les systèmes, paralyser les opérations ou voler des données.

Les conséquences destructrices des cyberattaques pour les réseaux d’entreprise, les systèmes médicaux, les infrastructures énergétiques, les carrefours de transport et les organismes gouvernementaux de différents pays sont bien documentées. À l’échelle mondiale, les attaques de niveau étatique menées par la Chine, l’Iran, la Corée du Nord et la Russie menacent les infrastructures qui soutiennent la vie civile et les préparatifs militaires. Même des attaques à petite échelle visant un seul hôpital ou une seule école peuvent entraîner d’importantes pertes économiques, exposer des données sensibles, et même mettre des vies en danger. Les pertes économiques annuelles de la cybercriminalité mondiale sont difficiles à estimer avec précision, mais elles pourraient se situer autour de 500 milliards de dollars.

Par le passé, de nombreuses failles logicielles n’ont pas été découvertes pendant des années, car leur découverte et leur exploitation nécessitaient des connaissances professionnelles détenues par un très petit nombre d’experts en sécurité. Mais avec l’apparition des derniers modèles d’IA de pointe, le coût, l’effort et le seuil de compétence nécessaires pour découvrir et exploiter des vulnérabilités logicielles ont fortement diminué. Au cours de l’année écoulée, les modèles d’IA sont devenus de plus en plus performants en lecture de code et en raisonnement, avec des résultats particulièrement impressionnants en matière de découverte de failles et de construction de méthodes d’exploitation. Claude Mythos Preview a réalisé un bond en avant dans ces compétences en cybersécurité : certaines des vulnérabilités qu’il a découvertes étaient restées exploitables malgré des décennies d’examen humain et après des millions de tests de sécurité automatisés, et le code d’exploitation qu’il a développé est devenu de plus en plus sophistiqué.

Ten ans après la première édition du concours DARPA Cyber Grand Challenge, les modèles d’IA de pointe se rapprochent, voire égalent, les capacités les plus élevées des humains en matière de découverte et d’exploitation des vulnérabilités. Sans mesures de sécurité nécessaires, ces capacités réseau puissantes pourraient être utilisées pour exploiter une vaste quantité des failles existantes dans les logiciels les plus importants au monde. Les cyberattaques deviendraient plus fréquentes, plus destructrices, et donneraient de la puissance aux adversaires des États-Unis et de leurs alliés. C’est une priorité de sécurité que les démocraties doivent considérer comme essentielle.

La bonne nouvelle, c’est que les capacités qui rendent les modèles d’IA dangereux entre de mauvaises mains les rendent tout aussi extrêmement utiles pour découvrir et corriger des failles importantes — et pour produire de nouveaux logiciels comportant moins de bugs de sécurité. Project Glasswing est une étape importante pour permettre aux défenseurs d’établir un avantage durable dans l’imminent monde de la cybersécurité pilotée par l’IA.

Les capacités de Claude Mythos Preview pour découvrir des vulnérabilités et des méthodes d’exploitation

Au cours des dernières semaines, nous avons utilisé Claude Mythos Preview pour découvrir des milliers de vulnérabilités zero-day (c’est-à-dire des failles dont les concepteurs de logiciels n’avaient aucune connaissance préalable) dans chacun des systèmes d’exploitation majeurs, dans chacun des navigateurs majeurs, ainsi que dans une série d’autres logiciels importants, dont beaucoup sont de niveau à haut risque.

Sur le blog Frontier Red Team, nous avons divulgué une partie des détails techniques de certaines vulnérabilités déjà corrigées, ainsi que les méthodes d’exploitation trouvées par Mythos Preview. La découverte (et, pour beaucoup, le développement des méthodes d’exploitation associées) de presque toutes ces vulnérabilités a été entièrement réalisée de manière autonome par le modèle, sans aucune orientation humaine. Voici trois exemples :

Mythos Preview a découvert une vulnérabilité qui existait depuis 27 ans dans OpenBSD. OpenBSD est réputé pour son niveau extrêmement élevé de durcissement de la sécurité et est largement utilisé pour les pare-feu et d’autres infrastructures critiques. Cette vulnérabilité permet à un attaquant de provoquer à distance l’effondrement du système simplement en se connectant à la machine cible.

Il a également découvert une vulnérabilité qui existait depuis 16 ans dans FFmpeg. FFmpeg est utilisé par d’innombrables logiciels pour le codage et le décodage vidéo. Le problème se trouve dans une seule ligne de code, et des outils de test automatisés ont frappé cette ligne 5 millions de fois, sans jamais détecter le problème.

Le modèle a découvert de manière autonome et enchaîné plusieurs vulnérabilités dans le noyau Linux (le noyau Linux exécute la majorité des serveurs dans le monde) afin de réaliser une attaque d’escalade des privilèges : depuis des droits d’utilisateur ordinaires jusqu’au contrôle total de la machine.

Nous avons entièrement signalé les vulnérabilités ci-dessus aux mainteneurs des logiciels concernés, et elles ont toutes été corrigées. Pour de nombreuses autres vulnérabilités, nous fournissons aujourd’hui des détails de hachage cryptographique (voir le blog Red Team), en attendant que la correction soit terminée avant de divulguer les informations spécifiques.

Les bancs d’évaluation, tels que CyberGym, ont également validé l’écart significatif entre Mythos Preview et notre modèle juste en dessous, Claude Opus 4.6 :

Reproduction des vulnérabilités en cybersécurité - CyberGym

En plus de notre propre travail, de nombreux partenaires ont également utilisé Claude Mythos Preview pendant plusieurs semaines. Voici leurs retours :

« Les capacités de l’IA ont franchi un seuil : elles changent fondamentalement le niveau d’urgence nécessaire pour protéger les infrastructures critiques contre les menaces cybernétiques, et c’est irréversible. Notre travail de base avec ces modèles montre qu’il est possible d’identifier et de corriger des vulnérabilités dans le matériel et les logiciels à une vitesse et à une échelle sans précédent. C’est un changement profond, et un signal clair : les méthodes classiques de durcissement ne suffisent plus. Les fournisseurs de technologies doivent adopter immédiatement de nouvelles approches, et les clients doivent se préparer au déploiement. C’est la raison pour laquelle Cisco a rejoint Project Glasswing : ce travail est trop important et trop urgent pour être mené en solo. »

— Anthony Grieco, vice-président senior et Chief Security and Trust Officer chez Cisco

« Chez AWS, nous construisons des défenses avant l’apparition des menaces, du matériel sur mesure à l’ensemble de la pile technologique. La sécurité n’est pas une affaire de phase : c’est une discipline continue, intégrée dans tout ce que nous faisons. Nos équipes analysent plus de 400 millions de milliards de requêtes de trafic réseau par jour afin de détecter les menaces, et l’IA est au cœur de nos capacités de défense à grande échelle. Nous testons depuis longtemps Claude Mythos Preview dans nos opérations de sécurité internes, en l’appliquant à des bases de code critiques ; il nous aide déjà à renforcer notre code. Nous injectons une expertise de sécurité approfondie issue de notre collaboration avec Anthropic, et nous aidons à renforcer Claude Mythos Preview afin que davantage d’organisations puissent avancer avec des standards de sécurité aussi élevés que possible. »

— Amy Herzog, vice-présidente d’AWS et Chief Information Security Officer

« Lorsque la cybersécurité ne dépend plus seulement de capacités humaines, l’opportunité d’utiliser l’IA de manière responsable pour améliorer la sécurité à grande échelle et réduire les risques est sans précédent. En rejoignant Project Glasswing et en obtenant l’accès à Claude Mythos Preview, nous pouvons identifier et atténuer les risques tôt, et renforcer nos solutions de sécurité et de développement afin de mieux protéger les clients et Microsoft. Lors de nos tests sur notre banc de sécurité open source CTI-REALM, Claude Mythos Preview a montré des améliorations substantielles par rapport aux modèles précédents. Nous attendons avec impatience de collaborer avec Anthropic et avec l’industrie plus largement afin d’améliorer les résultats de sécurité pour tous. »

— Igor Tsyganskiy, vice-président exécutif de la cybersécurité chez Microsoft et vice-président exécutif de Microsoft Research

« La fenêtre allant de la découverte d’une vulnérabilité à son exploitation par un attaquant s’est effondrée : ce qui prenait auparavant des mois peut désormais être fait en quelques minutes grâce à l’IA. Claude Mythos Preview démontre le potentiel pour que les défenseurs agissent à grande échelle, tandis que les adversaires chercheront inévitablement à exploiter des capacités similaires. Ce n’est pas une raison pour ralentir, c’est une raison d’avancer ensemble plus vite. Pour déployer l’IA, il faut des garanties de sécurité. C’est pourquoi CrowdStrike participe dès le premier jour. »

— Elia Zaitsev, Chief Technology Officer chez CrowdStrike

« Auparavant, l’expertise en sécurité était un luxe réservé aux organisations capables de constituer de grandes équipes de sécurité. Les mainteneurs de logiciels open source — dont les logiciels soutiennent une grande partie des infrastructures critiques dans le monde — n’ont généralement eu d’autre choix que de se débrouiller seuls pour traiter les problèmes de sécurité. Les logiciels open source constituent la majorité du code dans les systèmes modernes, y compris les systèmes eux-mêmes que les agents d’IA utilisent pour écrire de nouveaux logiciels. En donnant aux mainteneurs de ces dépôts open source critiques l’accès à de nouveaux modèles d’IA de génération — capables d’identifier et de corriger les vulnérabilités de manière proactive à grande échelle — Project Glasswing fournit une voie concrète pour changer la situation. C’est ainsi que la sécurité renforcée par l’IA passe d’un outil réservé aux grandes équipes à un assistant fiable pour chaque mainteneur. »

— Jim Zemlin, CEO de la Linux Foundation

« Renforcer la cybersécurité et la résilience du système financier est au cœur de la mission de JPMorgan, et nous pensons que lorsque les institutions de premier plan relèvent ensemble ce défi et collaborent, l’industrie est la plus forte. Project Glasswing apporte une opportunité unique et précoce : nous pouvons évaluer, selon nos propres critères, les capacités des outils d’IA de prochaine génération dans la cybersécurité défensive des infrastructures critiques, tout en menant cette bataille côte à côte avec des leaders technologiques respectés. Nous adopterons une approche rigoureuse et indépendante pour déterminer comment avancer et comment apporter notre aide. L’initiative d’Anthropic incarne la méthode prospective et collaborative requise à ce moment. »

— Pat Opet, Chief Information Security Officer chez JPMorgan

« Google se réjouit de voir se former cette initiative intersectorielle de cybersécurité, et fournit Mythos Preview aux participants via Vertex AI. La collaboration de l’industrie sur les enjeux de sécurité émergents a toujours été essentielle, que ce soit la cryptographie post-quantique, la divulgation responsable de vulnérabilités zero-day, la sécurité des logiciels open source ou la défense contre les attaques fondées sur l’IA. Nous avons toujours cru que l’IA apporte à la fois de nouveaux défis et de nouvelles opportunités pour la défense contre les cyberattaques — c’est pour cela que nous avons construit des outils pilotés par l’IA comme Big Sleep et CodeMender pour découvrir et corriger des failles de sécurité critiques dans les logiciels. Nous continuerons à investir dans des plateformes de cybersécurité de pointe et dans une culture centrée sur la protection des utilisateurs, des clients, de l’écosystème et de la sécurité nationale. »

— Heather Adkins, vice-présidente de l’ingénierie de la sécurité chez Google

« Au cours des dernières semaines, nous avons utilisé le modèle Claude Mythos Preview pour identifier des vulnérabilités complexes que les modèles de génération précédente avaient entièrement omises. Cela ne modifie pas seulement les règles du jeu en matière de découverte de failles cachées ; cela signifie aussi que les attaquants pourront découvrir encore davantage de vulnérabilités zero-day et développer le code d’exploitation à une vitesse bien supérieure à celle observée auparavant. Il est évident que ces modèles doivent être remis aux propriétaires de projets open source et à l’ensemble des défenseurs, afin de découvrir et corriger les vulnérabilités avant que les attaquants n’obtiennent l’accès. Et peut-être plus important encore : tout le monde doit se préparer aux attaques assistées par l’IA. Les attaques seront plus nombreuses, plus rapides et plus complexes. Il est temps d’effectuer une mise à niveau complète de l’écosystème de cybersécurité. Nous saluons la collaboration d’Anthropic avec l’industrie pour s’assurer que ces capacités puissantes servent en priorité la défense. »

— Lee Klarich, Chief Product and Technology Officer chez Palo Alto Networks

Les puissantes capacités de cybersécurité de Claude Mythos Preview proviennent de son exceptionnelle capacité d’encodage et de raisonnement d’agents. Les résultats d’évaluation ci-dessous montrent que ce modèle obtient le meilleur score parmi tous les modèles connus sur plusieurs tâches de codage de logiciels.

Encodage d’agents

Raisonnement

Recherche d’agents et utilisation d’ordinateurs

Notes :

SWE-bench Verified, Pro et Multilingual : le filtrage par mémorisation a marqué une partie des tâches. Une fois les tâches susceptibles de contenir de la mémorisation exclues, l’ampleur de l’avantage de Mythos Preview par rapport à Opus 4.6 reste inchangée.

SWE-bench Multimodal : utilisation d’une implémentation interne, le score n’est pas directement comparable à celui des classements publics.

Terminal-Bench 2.0 : utilisation du cadre Terminus-2, mode de pensée adaptatif à effort maximal ; budget total maximal de 1 000 000 token par tâche ; allocation de ressources 1x garantie / 3x plafond ; pour chaque tâche, 5 tentatives en moyenne. En augmentant la limite de timeout à 4 heures et en utilisant Terminal-Bench 2.1 pour la mise à jour, le score de Mythos Preview atteint 92,1 %.

BrowseComp : Claude Mythos Preview obtient un score plus élevé que Opus 4.6, tandis que la consommation de tokens n’est que de 1/4,9 de celle de ce dernier.

Humanity’s Last Exam : Mythos continue à bien performer en mode à faible effort, avec une possible part de mémorisation.

Pour plus d’informations sur les capacités du modèle, ses attributs de sécurité et ses caractéristiques de base, veuillez consulter la fiche système de Claude Mythos Preview.

Nous ne prévoyons pas d’ouvrir Claude Mythos Preview au public, mais l’objectif final est de permettre aux utilisateurs de déployer en toute sécurité, à grande échelle, des modèles de niveau Mythos — non seulement pour la cybersécurité, mais aussi pour de nombreuses autres valeurs que ce type de modèle à forte capacité apporte. Pour cela, nous devons progresser dans le développement de mécanismes de protection en cybersécurité (et d’autres domaines) capables de détecter et d’empêcher les sorties les plus dangereuses du modèle. Nous prévoyons de publier de nouvelles protections de sécurité dans le prochain modèle Claude Opus, afin de pouvoir améliorer et perfectionner ces mécanismes avec un modèle qui ne présente pas le même niveau de risque que Claude Mythos Preview.

Prochaines étapes de Project Glasswing

La publication d’aujourd’hui marque le début d’un effort à long terme. Pour réussir, il faudra une participation large et diversifiée, au sein et en dehors du secteur technologique.

Les partenaires de Project Glasswing obtiendront l’accès à Claude Mythos Preview pour découvrir et corriger des vulnérabilités et des faiblesses dans leurs systèmes de base — ces systèmes représentent une grande proportion de la surface d’attaque réseau partagée à l’échelle mondiale. Les priorités de travail attendues incluent la détection locale de vulnérabilités, les tests de boîtes noires binaires, le durcissement des endpoints et les tests d’intrusion des systèmes.

Les 100 millions de dollars d’accès/usage promis par Anthropic pour Project Glasswing et pour d’autres participants couvriront une grande partie de l’utilisation pendant la période d’aperçu de la recherche. Par la suite, Claude Mythos Preview sera fourni aux participants au prix de 25 dollars / 125 dollars par million de tokens d’entrée / de sortie (les participants pourront accéder au modèle via Claude API, Amazon Bedrock, Google Cloud Vertex AI et Microsoft Foundry).

En plus des quotas d’accès au modèle, nous avons également, par l’intermédiaire de la Linux Foundation, fait un don de 2,5 millions de dollars à Alpha-Omega et à OpenSSF, et de 1,5 million de dollars à la Apache Software Foundation, afin d’aider les mainteneurs de logiciels open source à faire face à ce changement de paysage (les mainteneurs intéressés peuvent demander l’accès via le programme Claude for Open Source).

Nous avons l’intention d’élargir continuellement ce travail en termes de périmètre, sur plusieurs mois, et de partager autant d’expériences que possible, afin que d’autres organisations puissent appliquer ces retours à leur propre sécurité. Les partenaires se partageront mutuellement des informations et des bonnes pratiques dans la limite des conditions ; dans un délai de 90 jours, Anthropic publiera un rapport de nos résultats, ainsi que les vulnérabilités corrigées et les mesures d’amélioration qui peuvent être divulguées. Nous collaborerons également avec des organisations de sécurité de premier plan pour élaborer un ensemble de recommandations pratiques sur l’évolution des pratiques de sécurité à l’ère de l’IA, qui pourraient couvrir : des processus de divulgation des vulnérabilités, des processus de mise à jour des logiciels, la sécurité des logiciels open source et de la chaîne d’approvisionnement, le cycle de vie du développement logiciel et les pratiques de conception sécurisée, des standards des secteurs réglementés, l’extension du triage et de l’automatisation, ainsi que l’automatisation des correctifs.

Anthropic discute également depuis un certain temps avec des responsables du gouvernement américain des capacités offensives et défensives en cybersécurité de Claude Mythos Preview. Protéger les infrastructures critiques est la priorité n°1 de sécurité nationale des États démocratiques — l’émergence de ces capacités de cybersécurité montre une nouvelle fois que les États-Unis et leurs alliés doivent rester résolument en tête sur le plan des technologies d’IA. Le gouvernement joue un rôle indispensable pour aider à maintenir cet avantage, et pour évaluer et atténuer les risques de sécurité nationale liés aux modèles d’IA. Nous sommes disposés à collaborer avec des représentants des gouvernements à tous les niveaux pour contribuer à ces tâches.

Nous espérons que Project Glasswing suscitera un effort à plus grande échelle, couvrant à la fois le secteur de l’industrie et le secteur public, afin que toutes les parties répondent ensemble à la principale difficulté liée à l’impact des modèles puissants sur la sécurité. Nous invitons d’autres acteurs du secteur de l’IA à rejoindre l’initiative pour aider à définir des standards de l’industrie. À moyen terme, une organisation tierce indépendante — capable de rassembler des organisations du secteur privé et du secteur public — pourrait constituer la plateforme idéale pour porter la poursuite de ces grands projets de cybersécurité.

Annexe

Le projet porte le nom du papillon Ailes de verre (Greta oto). Cette métaphore a deux niveaux de signification : les ailes transparentes du papillon lui permettent de rester invisible, comme les vulnérabilités cachées dans le code dont il est question dans cet article ; les ailes transparentes l’aident aussi à éviter d’être blessé, comme la méthode de transparence que nous défendons.

Le mot Mythos vient de l’ancien grec et signifie « récit » ou « histoire » : les systèmes d’histoires utilisés par les civilisations pour comprendre le monde.

Les professionnels de la sécurité dont le travail est légalement affecté par ces mesures de sécurité peuvent demander l’accès au prochain programme de vérification en cybersécurité (Cyber Verification Program).

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler