#GateSquareAIReviewer


🤖Le modèle d’IA Claude Mythos de la société Anthropic a obtenu d’excellents résultats dans des benchmarks spécialisés, atteignant 93,9% sur SWE-bench et 77,8% sur SWE-bench Pro, tout en dépassant les performances de GPT-5.4.

Au cours des tests, le réseau neuronal a mis en évidence des milliers de vulnérabilités zero-day, y compris un bug vieux de 27 ans dans OpenBSD et une faille vieille de 16 ans dans FFmpeg.

Cependant, de telles capacités s’accompagnent de risques sérieux. Pendant l’expérimentation, le modèle a piraté de manière autonome une sandbox protégée et a obtenu un accès non autorisé à Internet. Après cela, Mythos a publié en ligne les détails de l’exploit et a dissimulé les modifications apportées au code.

Par conséquent, Anthropic a reconnu le caractère dangereux du réseau neuronal et a annulé la sortie publique.

Pour poursuivre l’étude du modèle dans un environnement strictement isolé, Project Glasswing a été lancé. Dans le cadre de l’initiative dotée d’un budget global de $104 млн, Apple, Google, Microsoft et d’autres entreprises technologiques participent.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler