阿里巴巴推出了用於機器人控制的人工智慧模型 - ForkLog

Tool_AI# 阿里巴巴推出人工智慧模型來控制機器人

阿里巴巴推出了 Qwen-Robot Suite — 一套用於機器人和物理環境任務的人工智慧模型:Qwen-RobotNav 用於導航,Qwen-RobotManip 用於物體操作,以及 Qwen-RobotWorld 用於預測場景發展。團隊將此專案描述為「完整的身體化智慧堆疊」。

📣 介紹 Qwen-Robot Suite — Qwen-RobotNav、Qwen-RobotManip、Qwen-RobotWorld,三個基礎模型,為具身智慧提供完整堆疊。

🧭 Qwen-RobotNav — 通往移動性的門戶。
• 將五個導航任務整合於一個模型:指令跟隨、點目標、… pic.twitter.com/noumjTtTeS

— Qwen (@Alibaba_Qwen) 2026年6月16日

這是指幫助物理代理感知環境、規劃行動並用自然語言執行命令的軟體模型。Qwen-Robot Suite 已在阿里雲的部分企業客戶中進行試點測試,應用於機器人技術領域。

為何阿里巴巴將 Qwen 推向物理世界

大型語言模型和多模態模型已能處理文本、圖像、影片和語音,但這對機器人來說還不夠。物理代理不僅需要理解指令,還要將其轉化為動作,考慮空間、物體屬性、感測器限制和行動後果。

阿里巴巴稱此為 physical AI,或「具身人工智慧」。在這種方法中,模型不僅要處理數位資料,還要與物理環境互動:移動、尋找物體、操控操縱器,並預測行動後的結果。

Qwen-RobotNav:一個模型中的五個導航任務

Qwen-RobotNav 負責導航。該模型整合了五組任務:

  • 指令跟隨;
  • 前往指定點;
  • 搜索物體;
  • 追蹤目標;
  • 自主駕駛。

根據阿里巴巴的資料,Qwen-RobotNav 基於 Qwen3-VL,並在 1560 萬個與路徑規劃和視覺語言推理相關的樣本上進行訓練。

公司宣稱在 VLN-CE RxR 上成功率達 76.5%,在 EVT-Bench 上達 90%。阿里巴巴也補充,該模型可作為更大代理系統的工具:高層模型規劃任務,Qwen-RobotNav 負責移動。

資料來源:Qwen。在阿里巴巴的演示中,描述了尋找室內遺失物品或檢查建築物中特定物件是否開啟的場景。在這些任務中,機器人不僅要移動,還要收集視覺證據並回傳結果給用戶。

Qwen-RobotManip:物體操作

Qwen-RobotManip 針對物理操作任務。模型應協助機器人抓取、移動和放置物品,並能在不同設備間轉移技能。

資料來源:Qwen-RobotManip。機器人技術的一個核心問題是行動描述的多樣性。多臂操縱器、雙手平台、帶夾持器的機器人或移動系統,使用不同的座標系、關節和指令格式。Qwen-RobotManip 嘗試將這些資料統一,讓在一種機器人上的訓練能幫助到其他類型的機器人。

阿里巴巴用超過 38,100 小時的資料進行訓練。這包括 11,320 小時的公開機器人資料、1933 小時的第一人稱人類動作影片,以及 24,808 小時的合成機器人演示,這些演示是基於上述影片生成的。

公司表示,該模型在 RoboChallenge Table30 v1 的通用模型賽道中獲得第一名。根據阿里巴巴,Qwen-RobotManip 也展現出對新指令、不熟悉物體的適應能力,以及跨機器人技能轉移的穩定性。

Qwen-RobotWorld:機器人世界模型

Qwen-RobotWorld 是一個由自然語言控制的視訊世界模型。它能預測在給定行動後,場景會如何發展。

資料來源:Qwen-RobotWorld。例如,模型接收當前觀測和文字指令,然後生成場景的可能未來狀態。此方法可用於操控、自主駕駛、導航、規劃,以及為機器人創建合成訓練資料。

為了訓練 Qwen-RobotWorld,團隊建立了 Embodied World Knowledge 資料庫。該資料庫包含 860 萬對「影片-文字」配對和超過 2 億張畫面,涵蓋超過 20 種機器人平台和 500 多類行動。

阿里巴巴表示,Qwen-RobotWorld 在 EWMBench 和 DreamGen Bench 中名列第一,並超越所有公開模型在 WorldModelBench 和 PBench 的表現。技術說明中還指出,該模型展現出與基本物理規律(如運動、質量守恆、液體和重力)高度一致的特性。

還有很長的路要走才能普及機器人

儘管取得了上述成果,Qwen-Robot Suite 目前仍是模型集,而非完整的商用機器人平台。實際應用面臨感測器噪聲、驅動器磨損、非標準情境、感知錯誤和大量稀有場景的挑戰。許多評測系統是在模擬或受控實驗條件下進行。

阿里巴巴也未公開存取費用、公開發布時間或已測試 Qwen-Robot Suite 的客戶名單。

提醒一下,4 月份阿里雲推出了 Qwen3.6-Plus 代理模型,具有 100 萬令牌的上下文窗口和外部工具支援。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆