Фудань Мейтуан в этой волне открытого исходного кода WBench довольно крутые, 289 кейсов полностью протестировали интерактивную мировую модель, показатель и ручное слепое тестирование имеют корреляцию выше 0.94, данные говорят сами за себя — лучше не хвастаться.

Посмотреть Оригинал
CoinNetwork
Фудань совместно с Meituan LongCat создали открытый интерактивный мировой модельный эталон WBench
Фудань и Meituan LongCat совместно открыли исходный код интерактивного мирового модели WBench, включающего 289 тестовых случаев, 1058 раундов взаимодействия, охватывающих перспективы первого и второго лица, навигационное управление, действия субъекта, редактирование событий и переключение перспективы. 22 автоматических метрики имеют коэффициент корреляции с человеческим слепым тестом ≥0.94. Результаты показывают, что управление взаимодействием и рендеринг модели, физика/согласованность практически разъединены, hy-world1.5 лидирует в навигационном управлении, lingbot-world — в согласованности, matrix-game3.0 — в движении и навигации.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено