Microsoft MDASH en tête du classement CyberGym, avec un taux de reproduction des vulnérabilités de 88,4 %

robot
Création du résumé en cours

AIMPACT message, le 14 mai (UTC+8), mise à jour du classement du cadre d’évaluation de la cybersécurité CyberGym, le système MDASH de Microsoft (système multi-modèles) se classe en première position avec un taux de réussite de 88,4 % dans la reproduction des vulnérabilités, dépassant l’Agent d’Anthropic (83,1 %) et l’Agent OpenAI (GPT-5.5, 81,8 %). Ce cadre comprend 1507 exemples de tests de référence, couvrant les vulnérabilités historiques de 188 grands projets logiciels. MDASH ne se contente pas de reproduire les vulnérabilités connues, il a également découvert 35 vulnérabilités zero-day et 17 correctifs incomplets dans l’histoire. CyberGym est construit à partir de vulnérabilités réelles découvertes via OSS-Fuzz, l’environnement d’évaluation inclut la base de code avant correction, et l’agent doit raisonner sur l’ensemble de la base de code (des milliers de fichiers, des millions de lignes de code) pour générer une preuve de concept. Taesoo Kim et d’autres membres de l’équipe de sécurité autonome de Microsoft ont été remerciés. (Source : InFoQ)

4-1,28%
ANTHROPIC-2,18%
OPENAI-0,57%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé