Fudan Meituan, cette vague d'ouverture de WBench est vraiment hardcore, 289 cas ont testé le modèle mondial interactif en profondeur, la corrélation entre les indicateurs et les tests manuels à l'aveugle est supérieure à 0,94, les données parlent d'elles-mêmes, mieux que de se vanter.

Voir l'original
CoinNetwork
Fudan s'associe à Meituan LongCat pour le référentiel de modèle mondial interactif open source WBench
Fudan et Meituan LongCat collaborent pour ouvrir la norme de modèle mondial interactif WBench, comprenant 289 cas de test, 1058 tours d'interaction, couvrant les perspectives à la première et à la deuxième personne, le contrôle de navigation, les actions principales, l'édition d'événements et le changement de perspective. 22 indicateurs automatiques ont un coefficient de corrélation ≥ 0,94 avec le test à l'aveugle humain. Les résultats montrent que le contrôle interactif et le rendu du modèle, la physique/la cohérence sont presque découplés, hy-world1.5 domine la navigation, lingbot-world domine la cohérence, matrix-game3.0 excelle dans la navigation par actions.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé