Aujourd'hui, Anthropic a publié leur modèle le plus dangereux


En quelque sorte. Le modèle s'appelle Mythos, et il est tellement doué pour trouver et pénétrer dans des logiciels que Anthropic a passé 2 mois à ne le laisser approcher que par des défenseurs cybernétiques et des entreprises d'infrastructure.
Ce que vous obtenez aujourd'hui, c'est Fable 5, le même modèle avec un filtre qui bloque les questions de cybersécurité, de biologie et de chimie et les confie à un modèle plus faible à la place.
Cependant, ce filtre ne s'active que sur moins de 5 % des sessions. Donc 95 % du temps, vous parlez de la chose qu'ils ont dit être trop dangereuse pour être distribuée.
L'équipe rouge d'Anthropic a passé 1 000 heures à essayer de contourner les sauvegardes et n'a pas réussi.
Mais Internet dispose de bien plus de 1 000 heures et d'une raison bien meilleure d'essayer. Chaque modèle verrouillé dans l'histoire a été piraté, généralement en quelques jours.
Les semaines à venir seront révélatrices.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé