O benchmark LongCat é interessante, pois desacopla o controlo da renderização, o hy-world1.5 tem navegação forte, o lingbot-world mantém a consistência estável, o matrix-game3.0 combina navegação de ação dupla, cada um tem as suas habilidades especiais, competir é bom para os desenvolvedores.

Ver original
CoinNetwork
Fudan em parceria com Meituan LongCat lança o padrão de modelo de mundo interativo de código aberto WBench
Fudan e Meituan LongCat unem-se para abrir o código do WBench, uma referência de modelo de mundo interativo, contendo 289 casos de teste, 1058 rodadas de interação, cobrindo perspectivas de primeira e segunda pessoa, controle de navegação, ações do sujeito, edição de eventos e troca de perspectivas. 22 métricas automáticas e o coeficiente de correlação com testes cegos humanos são ≥0,94. Os resultados mostram que o controle de interação e a renderização do modelo, física/consistência estão quase desacoplados, com hy-world1.5 liderando em controle de navegação, lingbot-world liderando em consistência, e matrix-game3.0 destacando-se em ações de navegação.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado