復旦美団のこのオープンソースWBenchはかなり本格的で、289のケースでインタラクティブな世界モデルを徹底的にテストし、指標と人工盲検の相関性は0.94以上。データが語るのは、口先だけの話よりも信頼できる。

原文表示
CoinNetwork
复旦大学と美団LongCatが共同開発したオープンソースのインタラクティブ世界モデル基準WBench
复旦与美团LongCat共同开源WBench交互式世界模型基准,含289个测试用例、1058轮交互,覆盖一二人称视角、导航控制、主体动作、事件编辑与视角切换。22项自动指标与人类盲测相关系数≥0.94。结果显示交互控制与模型渲染、物理/一致性几乎解耦,hy-world1.5领导航控制、lingbot-world领一致性、matrix-game3.0在动作导航居首。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め