通义千问發布首個原生語言世界模型Qwen-AgentWorld

ME AI 消息,據 動察 Beating 監測,通義千問團隊今日正式發布 Qwen-AgentWorld,這是首個將環境建模從繼續預訓練階段起即設定為訓練目標的原生語言世界模型,並非對通用大模型的後期適配。該模型在單一框架下同時覆蓋文本類環境(MCP、Search、Terminal、SWE)與 GUI 類環境(Web、OS、Android)共七大領域,基於超過 1000 萬條真實環境交互軌跡,經歷 CPT→SFT→RL 三階段訓練,實現了跨領域知識遷移。同步開源的還有 AgentWorldBench 評測基準,每條測試樣本均配備真實環境執行所得觀測數據,模型與評測基準已上線 Hugging Face 和 ModelScope。 在 AgentWorldBench 評測中,Qwen-AgentWorld-397B-A17B 取得最高整體模擬質量,超越 GPT-5.4、Claude Opus 4.8 與 Gemini 3.1 Pro。研究團隊還探索了世界建模在智能體訓練中的兩種應用路徑:作為解耦的環境模擬器,可控模擬 RL 能塑造智能體行為且顯著優於僅在真實環境中訓練的 RL;作為統一的智能體基礎模型,LWM 預熱訓練可遷移至涵蓋七個基準的多輪智能體任務,其中三個基準完全未在訓練集中出現,且無需智能體任務 RL 微調,初步驗證了語言世界模型作為更強智能體基礎模型的潛力。 點擊下方原文連結,加入動察 Beating · 飛書 AI 新聞渠道,7×24 小時不間斷監測全球 AI 熱點與新聞。 (來源:BlockBeats)
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆