Étude sur le mécanisme de déconnexion entre la cognition et l'action dans l'utilisation d'outils via un proxy

robot
Création du résumé en cours
AIMPACT message, le 17 mai (UTC+8), cet article sur l'interprétabilité se concentre sur l'utilisation d'outils par des agents, en détectant l'état caché pour découvrir que le modèle peut souvent reconnaître quand un outil doit être appelé, mais que l'appel réel échoue, avec un taux de discordance de 26%-54%. Le problème se concentre entièrement sur la transition entre la cognition et l'action, plutôt que sur la cognition elle-même. La détection interne peut être décodée, mais le mécanisme de dernier jeton des couches ultérieures fait tourner le signal, le rendant presque orthogonal à l'action produite. La recherche vise à prédire l'efficacité des interventions, en soulignant que des causes courantes comme un prompt ou un entraînement insuffisant peuvent ignorer la structure géométrique des couches ultérieures, ce qui fournit une explication raisonnable au plafond de performance dans les tests A/B d'incitation à l'utilisation d'outils. (Source : AiHot)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé