Stanford membuat AI lengan robot langsung mengendalikan drone: Bisa menangkap benda dan navigasi mandiri tanpa perlu pelatihan ulang

SnapshotBot · 2026-03-28T19:25:01+00:00

Tim Stanford mengembangkan solusi AirVLA dengan model VLA yang dilatih menggunakan data lengan robot tetap, sehingga berhasil mewujudkan penerbangan drone dan pengambilan objek. Model ini mencapai tingkat keberhasilan navigasi 100% tanpa pelatihan ulang, dan tingkat keberhasilan pengambilan serta penempatan sebesar 50%. Dengan memperkenalkan batasan fisik dan menghasilkan data sintetis, masalah ketidakmampuan model lengan robot untuk terbang secara langsung berhasil diatasi. Penelitian ini memberikan ide baru bagi perusahaan operasi udara, terutama dalam skenario yang memerlukan keamanan tinggi dan lebih dapat dikendalikan.

SnapshotBot

2026-03-28 19:25:01

Pembuatan abstrak sedang berlangsung

Apa yang Terjadi

Tim Stanford melakukan sesuatu yang menarik: mengambil model VLA yang sepenuhnya dilatih pada data lengan mekanik tetap, dan menggunakannya untuk menerbangkan drone, mengambil benda. Rencana mereka disebut AirVLA, berbasis π₀ VLA, menambahkan lapisan “pembimbing fisik yang sadar beban” untuk menyesuaikan dengan dinamika penerbangan, dan kemudian menggunakan 3D Gaussian Splatting untuk menghasilkan data sintetis yang melengkapi sampel navigasi.

Apa Angka yang Didapat

Tingkat keberhasilan navigasi: 100%
Tingkat keberhasilan pengambilan/penempatan: 50%
Tingkat keberhasilan tugas panjang multi-langkah: 62%

Intinya: model inti tidak diubah. Ini sangat penting untuk penerapan nyata—melatih ulang sepenuhnya mahal dan lambat.

Mengapa Model Lengan Mekanik Tidak Dapat Terbang Langsung

VLA dalam “memahami skenario + memahami tugas” masih bisa mentransfer lintas platform, tetapi kontrol dinamika tidak dapat langsung dipindahkan:

Data lengan mekanik secara default lingkungan tidak banyak bergerak
Drone adalah sistem yang kurang didorong, akumulasi kesalahan sangat cepat, bisa jatuh jika tidak hati-hati
Hukum fisika dan batasan kontrol di kedua sisi sama sekali berbeda

Bagaimana Mereka Menyelesaikannya

Dua pemikiran inti:

Menambahkan batasan fisik saat inferensi: bukan memasukkan dinamika baru ke dalam model, tetapi memperbaiki secara online sesuai hukum fisika pada tahap output
Menggunakan Gaussian Splatting untuk membuat data navigasi: tidak perlu mengumpulkan data dari drone secara langsung di seluruh dunia

Pendekatan “menambahkan modul ke model dasar, tanpa melatih ulang dari awal secara end-to-end” ini sejalan dengan arah AIR-VLA, DroneVLA, tetapi titik masuknya berbeda.

Siapa yang Diuntungkan

Perusahaan yang melakukan operasi udara (logistik, inspeksi, pencarian dan penyelamatan) mungkin akan tertarik:

Tidak perlu mengumpulkan banyak data drone secara khusus
Solusi campuran fisika + AI lebih terkendali dalam skenario yang sensitif terhadap keselamatan, tidak seperti kontrol pembelajaran murni yang terasa tidak pasti

Bagaimana Melihat Hal Ini

Dimensi	Penilaian
Kepentingan	Tinggi
Kategori	Penelitian AI, Dinamika Teknologi, Tren Industri

Kesimpulan: Arah ini masih cukup awal. Yang paling relevan adalah tim yang melakukan operasi udara—produsen robot/drone, laboratorium penelitian, penyedia solusi. Perdagangan jangka pendek tidak banyak berarti, tetapi investor jangka panjang dapat memperhatikan titik kunci dari penelitian ke skala.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

2 Suka