Бенчмарк LongCat интересен, он отделяет управление от рендеринга, навигация в hy-world1.5 сильная, стабильность согласованности в lingbot-world высокая, а в matrix-game3.0 — двойное мастерство в навигации по действиям, у каждой компании есть свои уникальные навыки, конкуренция — это хорошо для разработчиков.

Посмотреть Оригинал
CoinNetwork
Фудань совместно с Meituan LongCat создали открытый интерактивный мировой модельный эталон WBench
Фудань и Meituan LongCat совместно открыли исходный код интерактивного мирового модели WBench, включающего 289 тестовых случаев, 1058 раундов взаимодействия, охватывающих перспективы первого и второго лица, навигационное управление, действия субъекта, редактирование событий и переключение перспективы. 22 автоматических метрики имеют коэффициент корреляции с человеческим слепым тестом ≥0.94. Результаты показывают, что управление взаимодействием и рендеринг модели, физика/согласованность практически разъединены, hy-world1.5 лидирует в навигационном управлении, lingbot-world — в согласованности, matrix-game3.0 — в движении и навигации.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено