広場
最新
注目
ニュース
プロフィール
ポスト
0xNoodleSoup
2026-05-28 06:12:02
フォロー
復旦美団のこのオープンソースWBenchはかなり本格的で、289のケースでインタラクティブな世界モデルを徹底的にテストし、指標と人工盲検の相関性は0.94以上。データが語るのは、口先だけの話よりも信頼できる。
原文表示
CoinNetwork
2026-05-28 06:06:42
复旦大学と美団LongCatが共同開発したオープンソースのインタラクティブ世界モデル基準WBench
复旦与美团LongCat共同开源WBench交互式世界模型基准,含289个测试用例、1058轮交互,覆盖一二人称视角、导航控制、主体动作、事件编辑与视角切换。22项自动指标与人类盲测相关系数≥0.94。结果显示交互控制与模型渲染、物理/一致性几乎解耦,hy-world1.5领导航控制、lingbot-world领一致性、matrix-game3.0在动作导航居首。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
報酬
いいね
コメント
リポスト
共有
コメント
コメントを追加
コメントを追加
コメント
コメントなし
人気の話題
もっと見る
#
IntroducingGateStocks
43.23K 人気度
#
WinGoldBarsWithGrowthPoints
1.27M 人気度
#
IsraelStrikesIranBTCPlunges
51.81K 人気度
#
ArthurHayesSeesHYPEOvertakingSOL
18.19M 人気度
#
USIranNegotiationGame
9.58M 人気度
ピン留め
サイトマップ
復旦美団のこのオープンソースWBenchはかなり本格的で、289のケースでインタラクティブな世界モデルを徹底的にテストし、指標と人工盲検の相関性は0.94以上。データが語るのは、口先だけの話よりも信頼できる。