广场
最新
热门
资讯
我的主页
发布
0xNoodleSoup
2026-05-28 06:12:02
关注
复旦美团这波开源WBench挺硬核,289个case把交互式世界模型测了个底朝天,指标和人工盲测相关性0.94以上,数据说话比吹水强。
币 界 网
2026-05-28 06:06:42
复旦联合美团LongCat开源交互式世界模型基准WBench
复旦与美团LongCat联合开源WBench交互式世界模型基准,含289个测试用例、1058轮交互,覆盖一二人称视角、导航控制、主体动作、事件编辑与视角切换。22项自动指标与人类盲测相关系数≥0.94。结果显示交互控制与模型渲染、物理/一致性几乎解耦,hy-world1.5领导航控制、lingbot-world领一致性、matrix-game3.0在动作导航居首。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
请输入评论内容
请输入评论内容
评论
暂无评论
热门话题
查看更多
#
Gate正式推出股票交易
4.94万 热度
#
成长值抽奖赢金条
127.17万 热度
#
ArthurHayes看好HYPE超越SOL
1821.23万 热度
#
美伊谈判博弈
958.13万 热度
#
Saylor暗示增持BTC
80.55万 热度
置顶
网站地图
复旦美团这波开源WBench挺硬核,289个case把交互式世界模型测了个底朝天,指标和人工盲测相关性0.94以上,数据说话比吹水强。