A onda de código aberto WBench da Fudan Meituan é bastante robusta, com 289 casos testando o mundo interativo do modelo, a correlação entre os indicadores e a avaliação cega manual é superior a 0,94, os dados falam mais alto do que palavras vazias.

Ver original
CoinNetwork
Fudan em parceria com Meituan LongCat lança o padrão de modelo de mundo interativo de código aberto WBench
Fudan e Meituan LongCat unem-se para abrir o código do WBench, uma referência de modelo de mundo interativo, contendo 289 casos de teste, 1058 rodadas de interação, cobrindo perspectivas de primeira e segunda pessoa, controle de navegação, ações do sujeito, edição de eventos e troca de perspectivas. 22 métricas automáticas e o coeficiente de correlação com testes cegos humanos são ≥0,94. Os resultados mostram que o controle de interação e a renderização do modelo, física/consistência estão quase desacoplados, com hy-world1.5 liderando em controle de navegação, lingbot-world liderando em consistência, e matrix-game3.0 destacando-se em ações de navegação.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado