英伟达发布Gamma-World,多智能体世界模型支持四人协作与实时24 FPS

robot
摘要生成中
ME AI 消息,据 动察 Beating 监测,英伟达联合清华大学、多伦多大学以及 Vector Institute 的研究人员发表多智能体生成式世界模型 Gamma-World ,打破了虚拟环境模拟长期局限于单人或双人互动的瓶颈。团队目前发布了项目页面与论文,代码与权重计划于近期开源。 模型引入了旋转位置编码的高维推广和信息中介标记两项机制,在保证多名玩家能被独立控制的同时,首次实现了在无需重新训练的前提下,直接从双玩家零样本推广至四玩家协作。 多玩家世界模型的首要挑战,在于让每个玩家保持独立控制且动作互不冲突。研究团队设计了单工旋转智能体编码( Simplex Rotary Agent Encoding ),将经典的旋转位置编码( RoPE )推向高维角度空间。新编码方式让所有玩家拥有完全等价的物理对称性,不再依赖固定的玩家编号,从而实现更自然的独立指代与操控。 为了防止玩家增多导致计算量呈二次方暴增,方案引入了稀疏中心注意力( Sparse Hub Attention )机制。系统通过可学习的中心标记传递交互信息,将玩家之间的注意力计算成本成功压缩至线性级别。 在生成速度上,团队将高延迟的扩散模型教师蒸馏为因果模型学生,配合键值缓存( KV Cache )实现了每秒 24 帧( 24 FPS )的实时动作响应输出。多人游戏环境的评测表明,新模型在视频画面逼真度、动作响应可控性以及玩家间一致性上,均明显优于传统的插槽式和密集注意力网络。 (来源:BlockBeats)
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 8
  • 2
  • 分享
评论
请输入评论内容
请输入评论内容
GateUser-b74aba1c
· 4小时前
Sparse Hub Attention降到线性成本,终于不用看PPT了
回复0
MemeFisher
· 5小时前
KV缓存+教师蒸馏,工程优化拉满了
回复0
玻璃穹顶观察站
· 5小时前
画面可控性优于传统网络,生成式世界模型要成了
回复0
LiquidityLibrarian
· 5小时前
看完想去复现,发现缺卡
回复0
Arbiter of Fees
· 6小时前
英伟达这波是押注AI生成游戏世界了
回复0
ProofOfVibes
· 6小时前
各玩家独立控制这个点很关键,之前很多方案做不到
回复0
Margin Marmot
· 6小时前
双人直接扩四人,Scaling Law的新战场
回复0
情绪指标收割机
· 6小时前
传统网络:你们礼貌吗
回复0