📣 介紹 Qwen-Robot Suite — Qwen-RobotNav、Qwen-RobotManip、Qwen-RobotWorld，三個基礎模型，為具身智慧提供完整堆疊。

🧭 Qwen-RobotNav — 通往移動性的門戶。
• 將五個導航任務整合於一個模型：指令跟隨、點目標、… pic.twitter.com/noumjTtTeS

— Qwen (@Alibaba_Qwen) 2026年6月16日

這是指幫助物理代理感知環境、規劃行動並用自然語言執行命令的軟體模型。Qwen-Robot Suite 已在阿里雲的部分企業客戶中進行試點測試，應用於機器人技術領域。

為何阿里巴巴將 Qwen 推向物理世界

大型語言模型和多模態模型已能處理文本、圖像、影片和語音，但這對機器人來說還不夠。物理代理不僅需要理解指令，還要將其轉化為動作，考慮空間、物體屬性、感測器限制和行動後果。

阿里巴巴稱此為 physical AI，或「具身人工智慧」。在這種方法中，模型不僅要處理數位資料，還要與物理環境互動：移動、尋找物體、操控操縱器，並預測行動後的結果。

Qwen-RobotNav：一個模型中的五個導航任務

Qwen-RobotNav 負責導航。該模型整合了五組任務：

指令跟隨；
前往指定點；
搜索物體；
追蹤目標；
自主駕駛。

根據阿里巴巴的資料，Qwen-RobotNav 基於 Qwen3-VL，並在 1560 萬個與路徑規劃和視覺語言推理相關的樣本上進行訓練。

公司宣稱在 VLN-CE RxR 上成功率達 76.5%，在 EVT-Bench 上達 90%。阿里巴巴也補充，該模型可作為更大代理系統的工具：高層模型規劃任務，Qwen-RobotNav 負責移動。

資料來源：Qwen。在阿里巴巴的演示中，描述了尋找室內遺失物品或檢查建築物中特定物件是否開啟的場景。在這些任務中，機器人不僅要移動，還要收集視覺證據並回傳結果給用戶。

Qwen-RobotManip：物體操作

Qwen-RobotManip 針對物理操作任務。模型應協助機器人抓取、移動和放置物品，並能在不同設備間轉移技能。

資料來源：Qwen-RobotManip。機器人技術的一個核心問題是行動描述的多樣性。多臂操縱器、雙手平台、帶夾持器的機器人或移動系統，使用不同的座標系、關節和指令格式。Qwen-RobotManip 嘗試將這些資料統一，讓在一種機器人上的訓練能幫助到其他類型的機器人。

阿里巴巴用超過 38,100 小時的資料進行訓練。這包括 11,320 小時的公開機器人資料、1933 小時的第一人稱人類動作影片，以及 24,808 小時的合成機器人演示，這些演示是基於上述影片生成的。

公司表示，該模型在 RoboChallenge Table30 v1 的通用模型賽道中獲得第一名。根據阿里巴巴，Qwen-RobotManip 也展現出對新指令、不熟悉物體的適應能力，以及跨機器人技能轉移的穩定性。

Qwen-RobotWorld：機器人世界模型

Qwen-RobotWorld 是一個由自然語言控制的視訊世界模型。它能預測在給定行動後，場景會如何發展。

資料來源：Qwen-RobotWorld。例如，模型接收當前觀測和文字指令，然後生成場景的可能未來狀態。此方法可用於操控、自主駕駛、導航、規劃，以及為機器人創建合成訓練資料。

為了訓練 Qwen-RobotWorld，團隊建立了 Embodied World Knowledge 資料庫。該資料庫包含 860 萬對「影片-文字」配對和超過 2 億張畫面，涵蓋超過 20 種機器人平台和 500 多類行動。

阿里巴巴表示，Qwen-RobotWorld 在 EWMBench 和 DreamGen Bench 中名列第一，並超越所有公開模型在 WorldModelBench 和 PBench 的表現。技術說明中還指出，該模型展現出與基本物理規律（如運動、質量守恆、液體和重力）高度一致的特性。

還有很長的路要走才能普及機器人

儘管取得了上述成果，Qwen-Robot Suite 目前仍是模型集，而非完整的商用機器人平台。實際應用面臨感測器噪聲、驅動器磨損、非標準情境、感知錯誤和大量稀有場景的挑戰。許多評測系統是在模擬或受控實驗條件下進行。

阿里巴巴也未公開存取費用、公開發布時間或已測試 Qwen-Robot Suite 的客戶名單。

提醒一下，4 月份阿里雲推出了 Qwen3.6-Plus 代理模型，具有 100 萬令牌的上下文窗口和外部工具支援。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

打賞
按讚
回覆
轉發
分享

回覆

請輸入回覆內容

暫無回覆

熱門話題
查看更多
#
我的Gate交易時刻
102.97萬熱度
#
美伊談判推遲
2027.59萬熱度
#
預測世界盃德國VS科特迪瓦
91.75萬熱度
#
TradFiCFD黃金大師賽
207.33萬熱度
#
持有USD1即享收益
9.73萬熱度

阿里巴巴推出了用於機器人控制的人工智慧模型 - ForkLog

為何阿里巴巴將 Qwen 推向物理世界

Qwen-RobotNav：一個模型中的五個導航任務

Qwen-RobotManip：物體操作

Qwen-RobotWorld：機器人世界模型

還有很長的路要走才能普及機器人

熱門話題

我的Gate交易時刻

美伊談判推遲

預測世界盃德國VS科特迪瓦

TradFiCFD黃金大師賽

持有USD1即享收益

已置頂