Anthropic s’associe à 12 géants pour lancer le projet « Glass Wing », en utilisant le modèle Mythos, le plus puissant et non publié, pour réparer les vulnérabilités logicielles mondiales

Project Glasswing est une étape cruciale pour permettre aux défenseurs d’établir un avantage durable à l’aube de l’ère à venir de la cybersécurité pilotée par l’IA.

Auteur : Anthropic

Traduction : Deep Tide TechFlow

Guide de lecture - Deep Tide : Anthropic a publié un modèle de pointe Claude Mythos Preview, encore non divulgué au public, dont les capacités d’audit de code dépassent la grande majorité des experts humains en sécurité. Il peut découvrir de manière autonome des vulnérabilités de type zero-day, vieilles de plusieurs décennies.

Fort de cette capacité, Anthropic a lancé avec AWS, Apple, Google, Microsoft, Nvidia et d’autres 12 géants de la tech le plan Project Glasswing. Le projet prévoit une ligne de crédit de 100 millions de dollars, dans le but de combler les failles des logiciels critiques dans le monde entier avant que les attaquants n’obtiennent des capacités équivalentes.

Introduction

Aujourd’hui, nous annonçons Project Glasswing (plan « Glasswing »), une nouvelle initiative rassemblant des acteurs comme Amazon Web Services (AWS), Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, Nvidia et Palo Alto Networks, visant à protéger la sécurité des logiciels les plus critiques à l’échelle mondiale.

Nous lançons Project Glasswing parce qu’un nouveau modèle de pointe entraîné par Anthropic a démontré une capacité que nous estimons susceptible de remodeler la cybersécurité. Claude Mythos Preview est un modèle de pointe, polyvalent et pas encore publié, qui met en lumière un fait brutal : les capacités de codage des modèles d’IA ont atteint un niveau tel qu’en matière de découverte et d’exploitation de vulnérabilités logicielles, ils peuvent surpasser tout le monde, à l’exception des tout meilleurs experts.

Mythos Preview a déjà découvert des milliers de vulnérabilités à haut risque, couvrant chaque système d’exploitation majeur et chaque navigateur majeur. À la vitesse des progrès de l’IA, cette capacité va se diffuser dans un avenir proche et pourrait tomber entre les mains d’utilisateurs irresponsables. Les impacts sur l’économie, la sécurité publique et la sécurité nationale pourraient être considérables. Project Glasswing est une tentative urgente : faire en sorte que ces capacités soient prioritairement utilisées pour la défense.

Dans le cadre de Project Glasswing, les partenaires mentionnés utiliseront Mythos Preview dans leurs travaux de sécurité défensive ; Anthropic partagera les enseignements tirés afin que l’ensemble de l’industrie en bénéficie. Nous avons également ouvert l’accès à plus de 40 organisations qui construisent ou maintiennent des infrastructures logicielles critiques, afin qu’elles puissent scanner et renforcer leurs systèmes propriétaires ainsi que des systèmes open source. Anthropic s’engage à investir jusqu’à 100 millions de dollars de quota d’utilisation pour Mythos Preview, et à verser 4 millions de dollars en dons directs à des organisations de sécurité open source.

Project Glasswing n’est qu’un point de départ. Aucune institution ne peut résoudre seule les problèmes de cybersécurité : les développeurs d’IA de pointe, les autres éditeurs de logiciels, les chercheurs en sécurité, les mainteneurs open source et les gouvernements du monde entier ont tous des rôles irremplaçables. Protéger l’infrastructure réseau mondiale peut nécessiter des années ; en revanche, les capacités d’IA de pointe peuvent faire un bond majeur en quelques mois. Pour les défenseurs du réseau, il faut agir dès maintenant afin de prendre une longueur d’avance.

Cybersécurité à l’ère de l’IA

Les logiciels dont nous dépendons au quotidien — faire fonctionner les systèmes bancaires, stocker des dossiers médicaux, connecter les réseaux logistiques, maintenir la production d’électricité — ont toujours eu des bugs. La plupart sont sans grande importance, mais certains constituent des failles de sécurité graves : une fois découvertes, les attaquants peuvent détourner les systèmes, paralyser les opérations ou voler des données.

Les conséquences destructrices des cyberattaques sur les réseaux d’entreprise, les systèmes médicaux, les infrastructures énergétiques, les carrefours de transport et les organismes gouvernementaux de chaque pays sont désormais bien connues. À l’échelle mondiale, les attaques de niveau étatique provenant de Chine, d’Iran, de Corée du Nord et de Russie menacent les infrastructures qui soutiennent la vie civile et les préparatifs militaires. Même des attaques à petite échelle visant un seul hôpital ou une seule école peuvent entraîner d’importantes pertes économiques, exposer des données sensibles et même mettre des vies en danger. Les pertes économiques annuelles dues à la cybercriminalité mondiale sont difficiles à estimer précisément, mais elles pourraient se situer autour de 500 milliards de dollars.

Dans le passé, de nombreuses failles logicielles restaient non découvertes pendant des années, car les compétences nécessaires pour les trouver et les exploiter n’étaient détenues que par une poignée d’experts en sécurité. Mais avec l’apparition des derniers modèles d’IA de pointe, le coût, l’effort et la barrière de compétences nécessaires pour découvrir et exploiter des vulnérabilités logicielles ont considérablement diminué. Au cours de la dernière année, les modèles d’IA sont devenus de plus en plus forts en lecture de code et en inférence, avec des performances particulièrement impressionnantes dans la découverte de vulnérabilités et la construction de méthodes d’exploitation. Claude Mythos Preview a réalisé un saut significatif sur ces compétences en cybersécurité : certaines vulnérabilités qu’il a découvertes sont restées en vie malgré des décennies d’examen humain et des millions de tests de sécurité automatisés, et son code d’exploitation devient de plus en plus sophistiqué.

Une décennie après le tout premier concours DARPA Cyber Grand Challenge, les modèles d’IA de pointe se rapprochent, voire égalent, les capacités des meilleurs humains en matière de découverte et d’exploitation de vulnérabilités. Sans mesures de sécurité nécessaires, ces capacités réseau puissantes pourraient être utilisées pour exploiter l’énorme quantité de failles existant dans les logiciels les plus importants du monde. Les cyberattaques deviendraient plus fréquentes, plus destructrices, et offriraient à l’opposition des États-Unis et de leurs alliés un avantage. C’est une priorité de sécurité que les démocraties doivent prendre au sérieux.

La bonne nouvelle, c’est que les capacités qui rendent les modèles d’IA dangereux entre de mauvaises mains les rendent aussi extrêmement utiles pour découvrir et corriger des failles importantes — et pour produire de nouveaux logiciels avec moins de bugs de sécurité. Project Glasswing est une étape essentielle pour permettre aux défenseurs d’établir un avantage durable à l’aube de l’ère de la cybersécurité pilotée par l’IA.

Capacités de Claude Mythos Preview pour découvrir des vulnérabilités et des méthodes d’exploitation

Au cours des dernières semaines, nous avons utilisé Claude Mythos Preview pour découvrir des milliers de vulnérabilités zero-day (c’est-à-dire des failles dont les développeurs de logiciels concernés n’avaient pas connaissance auparavant) dans chaque système d’exploitation majeur, chaque navigateur majeur et une série d’autres logiciels importants. Beaucoup d’entre elles sont de niveau critique.

Sur le blog de Frontier Red Team, nous avons divulgué des détails techniques de certaines vulnérabilités déjà corrigées, ainsi que les méthodes d’exploitation trouvées par Mythos Preview. La découverte (et, pour beaucoup d’entre elles, le développement des exploitations associées) de presque toutes ces vulnérabilités a été entièrement réalisée de manière autonome par le modèle, sans aucune orientation humaine. Voici trois exemples :

  • Mythos Preview a découvert une vulnérabilité qui existait depuis 27 ans dans OpenBSD. OpenBSD est réputé pour son niveau très élevé de durcissement de la sécurité et est largement utilisé pour les pare-feu et d’autres infrastructures critiques. Cette vulnérabilité permet à un attaquant de faire planter à distance le système cible simplement en s’y connectant.
  • Il a aussi découvert une vulnérabilité de 16 ans dans FFmpeg. FFmpeg est utilisé par d’innombrables logiciels pour le codage et le décodage vidéo. Le problème se trouvait dans une seule ligne de code, et les outils de test automatisés avaient touché cette ligne 5 millions de fois sans jamais détecter le problème.
  • Le modèle a découvert de manière autonome et chaîné plusieurs vulnérabilités dans le noyau Linux (le noyau Linux fait tourner la majorité des serveurs dans le monde), réalisant une attaque d’élévation de privilèges allant d’un simple niveau d’utilisateur à un contrôle total de la machine.

Nous avons entièrement signalé les vulnérabilités ci-dessus aux mainteneurs des logiciels concernés, et elles ont toutes été corrigées. Pour de nombreuses autres vulnérabilités, nous fournissons aujourd’hui des détails sur les hachages chiffrés (voir le blog Red Team), en attente de la publication des informations précises une fois les corrections finalisées.

Des références d’évaluation comme CyberGym ont également confirmé un écart significatif entre Mythos Preview et notre modèle immédiatement inférieur Claude Opus 4.6 :

Reproduction de vulnérabilités de cybersécurité - CyberGym

En plus de notre propre travail, de nombreux partenaires ont également utilisé Claude Mythos Preview pendant plusieurs semaines. Voici leurs retours :

« Les capacités en matière d’IA ont franchi un seuil : elles changent fondamentalement le niveau d’urgence requis pour protéger les infrastructures critiques contre les menaces cyber, et cela de façon irréversible. Les travaux de base sur lesquels nous nous appuyons avec ces modèles montrent qu’il est possible d’identifier et de corriger des vulnérabilités dans le matériel et les logiciels avec une vitesse et une ampleur sans précédent. C’est un changement profond, et un signal clair : les anciens moyens de durcissement des systèmes ne suffisent plus. Les fournisseurs de technologie doivent adopter activement de nouvelles approches dès maintenant, et les clients doivent se préparer au déploiement. C’est la raison pour laquelle Cisco rejoint Project Glasswing — ce travail est trop important et trop urgent pour se faire seul. »

—— Anthony Grieco, vice-président senior et responsable sécurité et confiance chez Cisco

« Chez AWS, nous construisons des défenses avant même que la menace n’apparaisse — des puces personnalisées à l’ensemble de la pile technologique. La sécurité n’est pas une affaire de phase ; c’est continu, intégré à tout ce que nous faisons. Nos équipes analysent plus de 4 quadrillions d’entrées de trafic réseau chaque jour pour détecter les menaces, et l’IA est au cœur de nos capacités défensives à grande échelle. Nous avons testé Claude Mythos Preview dans nos opérations de sécurité, l’avons appliqué à des bases de code critiques, et il nous aide à renforcer le code. Nous injectons une expertise sécurité approfondie dans notre collaboration avec Anthropic, et nous aidons à renforcer Claude Mythos Preview afin que davantage d’organisations puissent avancer avec les plus hauts standards de sécurité. »

—— Amy Herzog, vice-présidente chez Amazon Web Services et responsable de l’information (CISO)

« Quand la cybersécurité n’est plus limitée à une pure capacité humaine, l’opportunité d’utiliser l’IA de manière responsable pour améliorer la sécurité à grande échelle et réduire le risque est sans précédent. Rejoindre Project Glasswing et obtenir l’accès à Claude Mythos Preview nous permet d’identifier et d’atténuer les risques tôt, et d’améliorer nos solutions de sécurité et de développement pour mieux protéger nos clients et Microsoft. En test sur notre banc d’essai open source de sécurité CTI-REALM, Claude Mythos Preview a montré des améliorations substantielles par rapport aux modèles précédents. Nous sommes impatients de collaborer avec Anthropic et avec l’industrie au sens large pour améliorer les résultats de sécurité pour tous. »

—— Igor Tsyganskiy, vice-président exécutif de la cybersécurité chez Microsoft et chez Microsoft Research

« La fenêtre entre la découverte d’une faille et son exploitation par un attaquant s’est effondrée : là où il fallait des mois, il suffit maintenant de quelques minutes avec l’IA. Claude Mythos Preview démontre le potentiel d’une action défensive à grande échelle, tandis que l’adversaire cherchera inévitablement à exploiter les mêmes capacités. Ce n’est pas une raison de ralentir, mais une raison d’accélérer ensemble. Déployer l’IA exige des garanties de sécurité. C’est pourquoi CrowdStrike est impliqué dès le premier jour. »

—— Elia Zaitsev, CTO chez CrowdStrike

« Par le passé, l’expertise en sécurité était un luxe réservé aux organisations disposant de grandes équipes sécurité. Les mainteneurs de logiciels open source — dont les logiciels soutiennent une grande partie des infrastructures critiques à l’échelle mondiale — ont historiquement dû se débrouiller seuls pour résoudre les problèmes de sécurité. Les logiciels open source constituent la majorité du code dans les systèmes modernes, y compris les systèmes eux-mêmes que les agents d’IA utilisent pour écrire de nouveaux logiciels. En donnant à ces mainteneurs de bibliothèques open source critiques l’accès à une nouvelle génération de modèles d’IA — capables d’identifier et de corriger les vulnérabilités de manière proactive à grande échelle — Project Glasswing fournit un chemin concret pour changer cette situation. C’est ainsi que la sécurité augmentée par l’IA passe d’un outil exclusif des grandes équipes à un assistant fiable pour chaque mainteneur. »

—— Jim Zemlin, PDG de la Linux Foundation

« Renforcer la cybersécurité et la résilience du système financier fait partie du cœur de la mission de JPMorgan Chase. Nous croyons que l’industrie est la plus forte lorsque des institutions de premier plan relèvent ce défi ensemble. Project Glasswing offre une opportunité précoce unique : nous pouvons évaluer, selon nos propres critères, les capacités des outils d’IA de prochaine génération en cybersécurité défensive pour les infrastructures critiques, tout en combattant à côté de leaders technologiques respectés. Nous adopterons une approche rigoureuse et indépendante pour déterminer comment avancer et comment apporter notre aide. L’initiative d’Anthropic reflète l’approche prospective et collaborative requise par ce moment. »

—— Pat Opet, CISO chez JPMorgan Chase

« Google se réjouit de voir se former cette initiative de cybersécurité intersectorielle et de fournir aux participants Mythos Preview via Vertex AI. La collaboration de l’industrie sur les sujets de sécurité émergents a toujours été cruciale, qu’il s’agisse de la cryptographie post-quantique, de la divulgation responsable des zero-days, de la sécurité des logiciels open source ou de la défense contre des attaques basées sur l’IA. Nous avons toujours cru que l’IA apporte à la fois de nouveaux défis et de nouvelles opportunités dans la défense des réseaux. C’est pourquoi nous avons construit des outils pilotés par IA comme Big Sleep et CodeMender pour découvrir et corriger des failles critiques dans les logiciels. Nous continuerons d’investir dans des plateformes de cybersécurité de premier plan et dans une culture centrée sur la protection des utilisateurs, des clients, de l’écosystème et de la sécurité nationale. »

—— Heather Adkins, vice-présidente, Ingénierie Sécurité chez Google

« Au cours des dernières semaines, nous avons utilisé le modèle Claude Mythos Preview pour identifier des vulnérabilités complexes que les modèles de la génération précédente avaient complètement manquées. Cela ne change pas seulement le jeu pour la découverte des vulnérabilités cachées — cela signifie aussi que les attaquants pourront rapidement découvrir davantage de vulnérabilités zero-day et développer du code d’exploitation plus vite qu’auparavant. Il est évident que ces modèles doivent être mis entre les mains des propriétaires des projets open source et de tous les défenseurs, afin de découvrir et corriger les vulnérabilités avant que les attaquants n’aient accès. Et peut-être plus important encore : tout le monde doit se préparer à des attaques assistées par l’IA. Les attaques seront plus nombreuses, plus rapides et plus complexes. Il est temps de procéder à un vaste rehaussement de toute la chaîne de cybersécurité. Nous apprécions la collaboration d’Anthropic avec l’industrie pour s’assurer que ces capacités puissantes servent d’abord la défense. »

—— Lee Klarich, CTO et responsable Produits & Technologie chez Palo Alto Networks

Les capacités puissantes de Claude Mythos Preview en cybersécurité proviennent de ses excellentes capacités de codage et de raisonnement d’agents. Les résultats d’évaluation ci-dessous montrent que le modèle obtient les meilleurs scores parmi tous les modèles connus sur plusieurs tâches de codage de logiciels.

Codage par agents

Raisonnement

Recherche par agents et utilisation d’ordinateurs

Notes :

  • SWE-bench Verified, Pro et Multilingual : les tags de criblage mémorisant signalent certaines tâches. En excluant les tâches susceptibles d’être mémorisées, l’avantage de Mythos Preview par rapport à Opus 4.6 reste inchangé.
  • SWE-bench Multimodal : utilisation d’une implémentation interne ; les scores ne peuvent pas être comparés directement avec ceux des classements publics.
  • Terminal-Bench 2.0 : utilisation du framework Terminus-2, mode de réflexion « effort maximal » adaptatif, budget total de 1 million de tokens par tâche, ressources allouées avec garantie 1x / limite supérieure 3x, moyenne sur 5 essais par tâche. Après avoir augmenté la limite de time-out à 4 heures et mis à jour vers Terminal-Bench 2.1, Mythos Preview obtient un score de 92,1%.
  • BrowseComp : Claude Mythos Preview obtient un score supérieur à Opus 4.6, tandis que la consommation de tokens n’est que de 1/4,9 par rapport à ce dernier.
  • Humanity’s Last Exam : Mythos reste performant en mode faible effort, avec possiblement un certain degré de mémorisation.

Pour plus d’informations sur les capacités, attributs de sécurité et caractéristiques de base de ce modèle, veuillez consulter la fiche système de Claude Mythos Preview.

Nous ne prévoyons pas d’ouvrir Claude Mythos Preview au public, mais l’objectif final est de permettre aux utilisateurs de déployer en toute sécurité à grande échelle des modèles de niveau Mythos — non seulement pour la cybersécurité, mais aussi pour de nombreuses autres valeurs que de tels modèles à haute capacité apportent. Pour cela, nous devons progresser dans le développement de mesures de sécurité de la cybersécurité (et d’autres) capables de détecter et d’empêcher les sorties les plus dangereuses du modèle. Nous prévoyons de publier de nouvelles mesures de sécurité dans le prochain modèle Claude Opus, afin de pouvoir améliorer et affiner ces mesures avec un modèle qui ne présente pas le même niveau de risque que Mythos Preview.

Prochaines étapes de Project Glasswing

Aujourd’hui, la publication marque le début d’un effort de long terme. Pour réussir, il faudra une participation large de l’ensemble de l’industrie technologique, ainsi que de l’extérieur.

Les partenaires de Project Glasswing obtiendront l’accès à Claude Mythos Preview afin de découvrir et corriger des vulnérabilités et des faiblesses dans leurs systèmes de base — lesquels représentent une grande partie de la surface d’attaque réseau partagée à l’échelle mondiale. Les axes de travail attendus incluent notamment la détection de vulnérabilités locales, les tests en boîte noire des binaires, le durcissement des endpoints et les tests d’intrusion système.

Le quota de 100 millions de dollars de l’équipe Anthropic et des autres participants pour l’utilisation du modèle couvrira une grande partie des usages pendant la phase de recherche et d’aperçu. Ensuite, Claude Mythos Preview sera proposé aux participants au prix de 25 dollars / 125 dollars par million de tokens d’entrée / de sortie (les participants pourront accéder au modèle via Claude API, Amazon Bedrock, Google Cloud Vertex AI et Microsoft Foundry).

En plus des quotas d’utilisation du modèle, nous avons également, via la Linux Foundation, fait un don de 2,5 millions de dollars à Alpha-Omega et de 1,5 million de dollars à OpenSSF, afin d’aider les mainteneurs de logiciels open source à faire face à cette nouvelle configuration (les mainteneurs intéressés peuvent demander l’accès via le programme Claude for Open Source).

Nous avons l’intention d’étendre progressivement le périmètre de ce travail sur plusieurs mois, et de partager autant d’enseignements que possible afin que d’autres organisations puissent appliquer ces expériences à leur propre sécurité. Dans la mesure du possible, les partenaires partageront entre eux des informations et des meilleures pratiques. Dans les 90 jours, Anthropic rendra publics un rapport sur nos découvertes, ainsi que les vulnérabilités corrigées et les mesures d’amélioration qui peuvent être divulguées. Nous collaborerons aussi avec des organisations de sécurité de premier plan pour élaborer un ensemble de recommandations pratiques sur l’évolution des pratiques de sécurité à l’ère de l’IA, qui pourraient couvrir : les processus de divulgation des vulnérabilités, les processus de mise à jour des logiciels, la sécurité open source et celle de la chaîne d’approvisionnement, le cycle de vie du développement logiciel et les pratiques de conception de sécurité, les normes de l’industrie soumise à régulation, l’extension du triage et l’automatisation, ainsi que l’automatisation des correctifs.

Anthropic discute également depuis un certain temps avec des responsables du gouvernement américain des capacités offensives et défensives de cybersécurité de Claude Mythos Preview. Protéger les infrastructures critiques est la priorité absolue en matière de sécurité nationale des démocraties — l’émergence de ces capacités de cybersécurité montre à nouveau que les États-Unis et leurs alliés doivent conserver un leadership décisif sur les technologies d’IA. Les gouvernements ont un rôle indispensable pour aider à maintenir ce leadership et pour évaluer et atténuer les risques de sécurité nationale associés aux modèles d’IA. Nous souhaitons collaborer avec des représentants de gouvernements à tous les niveaux pour contribuer à l’accomplissement de ces tâches.

Nous espérons que Project Glasswing donnera naissance à un effort à plus grande échelle couvrant l’industrie et le secteur public, et que toutes les parties répondront ensemble au principal enjeu lié à l’impact des modèles puissants sur la sécurité. Nous invitons d’autres membres de l’industrie de l’IA à se joindre à nous pour aider à définir des standards de l’industrie. À moyen terme, un organisme tiers indépendant — capable de rassembler des organisations des secteurs privé et public — pourrait être la plateforme idéale pour porter la suite de ces projets de cybersécurité à grande échelle.

Annexe

  1. Le projet est nommé d’après le papillon verre-ailé (Greta oto). Cette métaphore a deux sens : ses ailes transparentes lui permettent de se faire oublier, comme les vulnérabilités cachées dans le code dont nous parlons ici ; les ailes transparentes l’aident aussi à éviter d’être blessé, comme la méthode de transparence que nous prônons.
  2. Le terme Mythos vient du grec ancien, signifiant « récit » ou « histoire » : un système d’histoires que les civilisations utilisent pour comprendre le monde.
  3. Les professionnels de la sécurité dont le travail est affecté par ces mesures de sécurité peuvent demander l’accès au prochain programme de vérification en cybersécurité (Cyber Verification Program).
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler