GoPlus : l'attaque par « autorisation de mémoire historique » peut induire l'agent IA à effectuer des opérations financières

robot
Création du résumé en cours
ME News Actualités, 15 mai (UTC+8), selon GoPlus, son équipe AgentGuard a découvert une méthode d'attaque dissimulée : l'attaquant incite d'abord l'agent AI à se souvenir de préférences telles que "plus enclin à rembourser activement", puis déclenche des opérations financières via des expressions ambiguës comme "traiter selon la vieille règle" ou "traiter comme d'habitude".
Pour ce type de comportement à haut risque lié à "l'autorisation de mémoire historique", il faut faire très attention : les remboursements, transferts, suppressions, envois de messages, synchronisations de configurations sensibles doivent obligatoirement nécessiter une confirmation explicite dans la session en cours ;
Les écritures de mémoire impliquant "habitudes", "préférences", "vieille règle" doivent être considérées comme des modifications à haut risque de l'état ;
La mémoire à long terme doit être traçable : qui l'a écrite, quand, si elle a été confirmée ;
Les expressions ambiguës comme "traiter comme d'habitude" ou "comme avant" doivent par défaut augmenter le niveau de risque ;
Il ne faut pas laisser la mémoire à long terme remplacer l'autorisation en cours. (Source : PANews)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 7
  • 3
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
MevBreakRoom
· Il y a 6h
Une confirmation secondaire est nécessaire dans la session en cours, cette approche de correctif est correcte
Voir l'originalRépondre0
LendingPoolObserver
· Il y a 6h
La mémoire à long terme est devenue une porte dérobée.
Voir l'originalRépondre0
RetroRadioIridescence
· Il y a 6h
Les anciennes règles deviennent des pièges, qui peut les éviter
Voir l'originalRépondre0
WhaleInAGlassBottle
· Il y a 6h
Audit traçable + mise à niveau de l'autorisation en temps réel, une double assurance pour une tranquillité d'esprit
Voir l'originalRépondre0
PuppyLooksAtTvl
· Il y a 6h
Psychologie de l'attaquant parfaite : établir la confiance avec la machine avant de la piéger
Voir l'originalRépondre0
LatencyLullaby
· Il y a 6h
La préférence pour l'écriture = modification à haut risque, cette ligne rouge est clairement tracée
Voir l'originalRépondre0
DustyAlpha
· Il y a 6h
Cette chaîne d'attaque est conçue de manière assez sournoise, en habituant d'abord puis en déclenchant de manière floue, la sécurité de l'IA ne peut effectivement pas se limiter à une seule instruction.
Voir l'originalRépondre0
  • Épinglé