Alibaba meluncurkan tiga model Qwen-Robot! Navigasi robot, kontrol, simulasi fisika sekaligus lengkap

Alibaba Qwen Tim mengumumkan Rangkaian Qwen-Robot, yang mencakup tiga model dasar: navigasi, manipulasi, dan simulasi dunia fisik, yang menempati peringkat pertama dalam berbagai pengujian standar robot, dianggap sebagai momen Android di bidang robotik.
(Latar belakang: Alibaba Qianwen meluncurkan model "Qwen3.7-Plus" dengan harga turun drastis, tetapi dengan konsekuensi tidak membuka bobot model)
(Tambahan latar belakang: Meta masuk ke dunia robot humanoid! Membeli perusahaan AI startup Assured Robot Intelligence secara diam-diam, bertaruh pada "interaksi dunia fisik" menuju AGI)

Daftar isi artikel

Toggle

  • Qwen-RobotNav: Model navigasi serba bisa lima dalam satu
  • Qwen-RobotManip: Manipulasi lintas robot
  • Qwen-RobotWorld: Antarmuka umum berbasis bahasa
  • Bagaimana dibandingkan dengan laboratorium Barat?

(Sumber: Decrypt, Blog resmi Qwen)

Tim Qwen Alibaba merilis Rangkaian Qwen-Robot pada hari Selasa, sebuah "full-stack kecerdasan embodied" yang terdiri dari tiga model dasar. Qwen-RobotNav bertanggung jawab atas navigasi bergerak, Qwen-RobotManip untuk manipulasi mekanis, dan Qwen-RobotWorld untuk simulasi dunia fisik. Ketiga model ini beroperasi secara independen, tetapi digabungkan membentuk "Android moment" di bidang robotik, yang merupakan sistem operasi, bukan perangkat keras.

Qwen-RobotNav: Model navigasi serba bisa lima dalam satu

Model navigasi mengintegrasikan tugas mengikuti perintah, navigasi ke titik target, pencarian objek, pelacakan target, dan mengemudi otonom, masing-masing membutuhkan strategi memori visual yang berbeda. Sebagian besar model hanya fokus pada satu strategi, sedangkan Qwen-RobotNav menyediakan antarmuka parametrik: anggaran token, pengurangan waktu, bobot setiap kamera, sehingga planner dapat dikonfigurasi ulang selama eksekusi.

Model ini dilatih pada 15,6 juta sampel, dan berhasil mencapai tingkat keberhasilan 76,5% dalam pengujian standar VLN-CE RxR ( navigasi visual dan bahasa di lingkungan nyata), serta 90% dalam EVT-Bench (pelacakan target bergerak).

Qwen-RobotManip: Manipulasi lintas robot

Berbagai robot memiliki cara berbeda dalam merepresentasikan gerak, lengan robot Franka menggunakan sudut sendi, robot dua lengan ALOHA menggunakan posisi dan arah cakar, sedangkan robot humanoid menggunakan koordinat seluruh tubuh. Alibaba mengumpulkan sekitar 38.100 jam data pelatihan dari basis data robot sumber terbuka dan video manusia, tanpa bergantung pada data privat.

Model ini menempati posisi pertama dalam pengujian RoboChallenge Table30-v1, mengungguli metode sebelumnya sebanyak 20%.

Qwen-RobotWorld: Antarmuka umum berbasis bahasa

Ini adalah model paling ambisius, sebuah model dunia video berbasis bahasa yang menganggap bahasa alami sebagai antarmuka aksi universal. Perintah seperti "Ambil cangkir merah dan tuang air ke atas bunga" dapat digunakan untuk cakar, mobil otonom, maupun agen navigasi bergerak secara umum.

Korpus pengetahuan dunia embodied mencakup 8,6 juta pasangan teks-video, 200 juta frame, meliputi manipulasi (590.000 sampel, 1.300+ keterampilan, 20+ bentuk), mengemudi otonom (Waymo, NVIDIA PhysicalAI-AD), navigasi dalam ruangan, dan transfer manusia-mesin lintas 14 jenis lengan robot. Model ini menempati posisi pertama dalam pengujian EWMBench dan DreamGen Bench, serta mendapatkan skor sempurna dalam pengujian konsistensi fisik seperti hukum Newton, kekekalan massa, dinamika fluida, dan gravitasi.

Bagaimana dibandingkan dengan laboratorium Barat?

Laboratorium Barat seperti Google DeepMind, Nvidia, Figure, dan Physical Intelligence juga mengejar tujuan serupa, tetapi kebanyakan fokus pada navigasi atau manipulasi, bukan paket yang dapat dirakit secara seragam. Vertikal integrasi Alibaba dari chip hingga aplikasi berarti mereka menguasai seluruh ekosistem, dan semua model ini bersifat open-source.

Namun, pengembang juga mengingatkan bahwa ini adalah model perangkat lunak, bukan robot fisik, dan implementasi nyata di skenario rumah tangga masih membutuhkan waktu bertahun-tahun. Alibaba saat ini belum mengumumkan harga, jadwal, atau daftar pelanggan selain pilot.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan