通义千问发布首个原生语言世界模型Qwen-AgentWorld

ME AI 消息,据 动察 Beating 监测,通义千问团队今日正式发布 Qwen-AgentWorld,这是首个将环境建模从继续预训练阶段起即设为训练目标的原生语言世界模型,并非对通用大模型的后期适配。该模型在单一框架下同时覆盖文本类环境(MCP、Search、Terminal、SWE)与 GUI 类环境(Web、OS、Android)共七大领域,基于超 1000 万条真实环境交互轨迹,经历 CPT→SFT→RL 三阶段训练,实现了跨领域知识迁移。同步开源的还有 AgentWorldBench 评测基准,每条测试样本均配备真实环境执行所得观测数据,模型与评测基准已上线 Hugging Face 和 ModelScope。 在 AgentWorldBench 评测中,Qwen-AgentWorld-397B-A17B 取得最高整体模拟质量,超越 GPT-5.4、Claude Opus 4.8 与 Gemini 3.1 Pro。研究团队还探索了世界建模在智能体训练中的两种应用路径:作为解耦的环境模拟器,可控模拟 RL 能塑造智能体行为且显著优于仅在真实环境中训练的 RL;作为统一的智能体基础模型,LWM 预热训练可迁移至涵盖七个基准的多轮智能体任务,其中三个基准完全未在训练集中出现,且无需智能体任务 RL 微调,初步验证了语言世界模型作为更强智能体基础模型的潜力。 点击下方原文链接,加入动察 Beating · 飞书 AI 新闻渠道,7×24 小时不间断监测全球 AI 热点与新闻。 (来源:BlockBeats)
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论