Institut de recherche sur la sécurité de l'IA au Royaume-Uni : Claude Mythos Preview devient la première IA à réaliser une simulation d'attaque réseau d'entreprise autonome en franchissant 32 étapes

robot
Création du résumé en cours

ME News Actualités, le 14 avril (UTC+8), selon la surveillance de 1M AI News, l’Institut de recherche sur la sécurité de l’IA au Royaume-Uni (AISI) a publié l’évaluation des capacités de cybersécurité de Claude Mythos Preview. Lors d’une tâche CTF de niveau expert (difficile à réaliser par aucun modèle avant avril 2025), le taux de réussite de Mythos Preview atteint 73%. L’AISI a également construit le scénario de simulation d’attaque réseau d’entreprise en 32 étapes « The Last Ones » (TLO), couvrant tout le processus depuis la reconnaissance initiale jusqu’à la prise de contrôle complète du réseau, nécessitant environ 20 heures pour un humain. Mythos Preview est le premier modèle à réussir le parcours complet, avec 3 réussites sur 10 tests, chaque tentative moyenne atteignant 22 étapes. Claude Opus 4.6 se place en deuxième position, avec une moyenne de 16 étapes. L’AISI précise que ces résultats ont été obtenus dans des conditions contrôlées où l’accès au réseau était clairement guidé et fourni. L’environnement de test diffère significativement d’un réseau d’entreprise réel : absence de défense active, pas d’outils de défense, et aucune pénalité en cas de déclenchement d’alertes de sécurité. Il n’est donc pas possible de confirmer si Mythos Preview peut pénétrer un système fortement protégé. Il y a deux ans, les meilleurs modèles d’IA ne pouvaient presque pas réaliser des tâches réseau de base. L’AISI indique que cette vitesse de progrès exige une mise à jour des méthodes d’évaluation de la sécurité, et des tests continueront à l’avenir dans des environnements simulant une défense active et une réponse en temps réel. (Source : BlockBeats)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler