Le benchmark LongCat est intéressant, la séparation entre contrôle et rendu est réalisée, la navigation hy-world1.5 est performante, la cohérence de lingbot-world est stable, et la navigation d'action matrix-game3.0 est maîtrisée en double. Chaque équipe a ses compétences, et la compétition est bénéfique pour les développeurs.

Voir l'original
CoinNetwork
Fudan s'associe à Meituan LongCat pour le référentiel de modèle mondial interactif open source WBench
Fudan et Meituan LongCat collaborent pour ouvrir la norme de modèle mondial interactif WBench, comprenant 289 cas de test, 1058 tours d'interaction, couvrant les perspectives à la première et à la deuxième personne, le contrôle de navigation, les actions principales, l'édition d'événements et le changement de perspective. 22 indicateurs automatiques ont un coefficient de corrélation ≥ 0,94 avec le test à l'aveugle humain. Les résultats montrent que le contrôle interactif et le rendu du modèle, la physique/la cohérence sont presque découplés, hy-world1.5 domine la navigation, lingbot-world domine la cohérence, matrix-game3.0 excelle dans la navigation par actions.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé