L'équipe de Berkeley annonce avoir cassé 8 principaux benchmarks d'évaluation d'agents intelligents et avoir publié les outils en open source

ME News Actualités, le 19 avril (UTC+8), le groupe de recherche en intelligence artificielle de Berkeley (berkeley_ai) a relayé la déclaration de Dawn Song, annonçant que son équipe avait réussi à percer 8 principaux benchmarks d’évaluation d’agents intelligents. L’équipe a décidé de rendre open source les outils utilisés pour atteindre ce résultat, et les a nommés BenchJack. Cet outil est décrit comme une “pénétration de test pour l’évaluation”, visant à aider d’autres développeurs à tester activement et à découvrir les faiblesses potentielles de leurs systèmes d’évaluation. (Source : InFoQ)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler