Alibaba memperkenalkan model AI untuk pengelolaan robot - ForkLog

Tool_AI# Alibaba perkenalkan Model AI untuk pengelolaan robot

Alibaba memperkenalkan Qwen-Robot Suite — rangkaian model AI untuk robot dan tugas di lingkungan fisik: Qwen-RobotNav untuk navigasi, Qwen-RobotManip untuk tindakan dengan objek dan Qwen-RobotWorld untuk memprediksi perkembangan scene. Tim menggambarkan proyek ini sebagai "full stack untuk kecerdasan tertanam".

📣 Memperkenalkan Qwen-Robot Suite — Qwen-RobotNav, Qwen-RobotManip, Qwen-RobotWorld, tiga model dasar, full stack untuk kecerdasan tertanam.

🧭 Qwen-RobotNav — gerbang menuju mobilitas.
• Menggabungkan 5 tugas navigasi dalam satu model: mengikuti instruksi, tujuan titik,… pic.twitter.com/noumjTtTeS

— Qwen (@Alibaba_Qwen) 16 Juni 2026

Ini adalah model perangkat lunak yang dirancang untuk membantu agen fisik dalam memahami lingkungan sekitar, merencanakan tindakan, dan menjalankan perintah dalam bahasa alami. Qwen-Robot Suite saat ini sedang menjalani uji coba pilot dengan beberapa klien korporat Alibaba Cloud di bidang robotika.

Mengapa Alibaba memperkenalkan Qwen ke dunia fisik

Model bahasa besar dan multimodal sudah mampu bekerja dengan teks, gambar, video, dan suara, tetapi ini belum cukup untuk robot. Agen fisik tidak hanya perlu memahami perintah, tetapi juga mengubahnya menjadi gerakan, mempertimbangkan ruang, properti objek, batasan sensor, dan konsekuensi dari tindakan.

Alibaba menyebut ini sebagai bidang AI fisik, atau "kecerdasan buatan tertanam". Dalam pendekatan ini, model harus bekerja tidak hanya dengan data digital, tetapi juga dengan lingkungan fisik: bergerak, menemukan objek, mengendalikan manipulator, dan memprediksi apa yang akan terjadi setelah tindakan.

Qwen-RobotNav: lima tugas navigasi dalam satu model

Qwen-RobotNav bertanggung jawab atas navigasi. Model ini menggabungkan lima kelompok tugas:

  • mengikuti instruksi;
  • bergerak ke titik yang ditentukan;
  • mencari objek;
  • melacak target;
  • mengemudi secara otomatis.

Menurut Alibaba, Qwen-RobotNav dibangun berdasarkan Qwen3-VL dan dilatih pada 15,6 juta sampel terkait perencanaan rute dan penalaran visual-bahasa.

Perusahaan mengklaim keberhasilan 76,5% di VLN-CE RxR dan 90% di EVT-Bench. Alibaba juga menyatakan bahwa model ini dapat berfungsi sebagai alat untuk sistem agen yang lebih besar: model tingkat atas merencanakan tugas, sementara Qwen-RobotNav bertanggung jawab atas pergerakan.

Sumber: Qwen. Dalam demonstrasi, Alibaba menggambarkan skenario seperti pencarian barang hilang di dalam ruangan atau memeriksa apakah objek tertentu di gedung sudah terbuka. Dalam tugas-tugas ini, robot tidak hanya harus bergerak, tetapi juga mengumpulkan bukti visual dan mengembalikan jawaban kepada pengguna.

Qwen-RobotManip: tindakan dengan objek

Qwen-RobotManip dirancang untuk tindakan fisik dengan objek. Model ini harus membantu robot mengambil, memindahkan, dan menempatkan benda, serta mentransfer keterampilan antar berbagai jenis perangkat.

Sumber: Qwen-RobotManip. Salah satu masalah utama dalam robotika adalah bahwa robot mendeskripsikan tindakan secara berbeda. Manipulator, platform dua tangan, robot dengan lengan, atau sistem mobile menggunakan koordinat, sendi, dan format perintah yang berbeda. Qwen-RobotManip berusaha menyatukan data ini ke dalam representasi umum, sehingga pelatihan pada satu jenis robot dapat membantu robot lain.

Untuk pelatihan, Alibaba menggunakan lebih dari 38.100 jam data. Data ini mencakup 11.320 jam data robot terbuka, 1.933 jam video aksi manusia dari sudut pandang pertama, dan 24.808 jam demonstrasi robot sintetis yang dibuat berdasarkan video tersebut.

Perusahaan menyatakan bahwa model ini menempati posisi pertama di RoboChallenge Table30 v1 dalam kategori model universal. Menurut Alibaba, Qwen-RobotManip juga menunjukkan ketahanan terhadap instruksi baru, objek yang tidak dikenal, dan transfer keterampilan antar robot yang berbeda.

Qwen-RobotWorld: model dunia untuk robot

Qwen-RobotWorld adalah model dunia berbasis video yang dikendalikan oleh bahasa alami. Model ini harus memprediksi bagaimana scene akan berkembang setelah tindakan tertentu.

Sumber: Qwen-RobotWorld. Misalnya, model menerima observasi saat ini dan perintah teks, lalu menghasilkan prediksi kondisi masa depan lingkungan yang kemungkinan besar terjadi. Pendekatan ini dapat digunakan untuk manipulasi, mengemudi otomatis, navigasi, perencanaan, dan pembuatan data pelatihan sintetis untuk robot.

Untuk pelatihan Qwen-RobotWorld, tim mengumpulkan korpus Embodied World Knowledge. Korpus ini mencakup 8,6 juta pasangan "video-teks" dan lebih dari 200 juta frame, mencakup lebih dari 20 tipe platform robotik dan lebih dari 500 kategori tindakan.

Alibaba menyatakan bahwa Qwen-RobotWorld menempati posisi pertama di EWMBench dan DreamGen Bench, serta mengungguli semua model terbuka di WorldModelBench dan PBench. Dalam deskripsi teknisnya, juga dikatakan bahwa model ini menunjukkan konsistensi tinggi dengan hukum fisika dasar — gerak, konservasi massa, cairan, dan gravitasi.

Masih jauh dari robot massal

Meskipun hasil yang diumumkan menjanjikan, Qwen-Robot Suite saat ini masih berupa rangkaian model, bukan platform robot konsumen yang siap pakai. Implementasi nyata menghadapi tantangan seperti noise sensor, keausan aktuator, situasi tak terduga, kesalahan persepsi, dan banyak skenario langka. Banyak benchmark yang digunakan untuk membandingkan sistem ini dilakukan dalam simulasi atau kondisi eksperimen terbatas.

Alibaba juga belum mengungkapkan biaya akses, jadwal peluncuran publik, maupun daftar klien yang sudah menguji Qwen-RobotSuite.

Sebagai catatan, pada bulan April, Alibaba Cloud memperkenalkan model agen Qwen3.6-Plus dengan jendela konteks 1 juta token dan dukungan alat eksternal.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan