El benchmark LongCat es interesante, desacopla el control y el renderizado, la navegación en hy-world1.5 es fuerte, la consistencia en lingbot-world es estable, y en matrix-game3.0 se combina la navegación por movimiento y la acción, cada uno tiene sus propias habilidades especiales, competir entre sí es bueno para los desarrolladores.

Ver original
CoinNetwork
Fudan se une a Meituan LongCat para desarrollar el estándar de modelos interactivos del mundo abierto WBench
Fudan y Meituan LongCat colaboran en la apertura del estándar de modelos interactivos del mundo WBench, que incluye 289 casos de prueba, 1058 rondas de interacción, cubriendo perspectivas en primera y segunda persona, control de navegación, acciones del sujeto, edición de eventos y cambio de perspectiva. 22 métricas automáticas y coeficientes de correlación con pruebas ciegas humanas ≥0.94. Los resultados muestran que el control de interacción y la renderización del modelo, la física y la coherencia están casi desacoplados, con hy-world1.5 liderando en control de navegación, lingbot-world en coherencia, y matrix-game3.0 en acciones y navegación en primer lugar.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado