Dawn Song, ce point de vue est très crucial : se concentrer uniquement sur le score, c'est comme ne regarder que le score global d'un bilan de santé, alors que la véritable question à poser est « où ça ne va pas, comment ça s'est dégradé ». L'évaluation des agents intelligents devrait également être ainsi, en décomposant l'échec en modèles diagnostiquables, afin de traiter le problème de manière ciblée.

Voir l'original
MeNews
Berkeley AI souligne que comprendre la raison de l'échec est plus important que le score de référence
Les recherches de Berkeley AI et le point de vue de Dawn Song soulignent que, lors de l’évaluation des agents intelligents, il faut accorder une importance particulière aux causes spécifiques des échecs de compréhension, plutôt qu’à la seule note de référence. Il faut décomposer les échecs à long terme en modèles diagnostiquables, afin de mieux localiser et analyser où et pourquoi l’agent échoue. Le texte original ne fournit pas d’informations sur des références spécifiques, des détails d’analyse ou la classification des modèles d’échec.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé