Stanford membuat AI lengan robot langsung mengendalikan drone: Bisa menangkap benda dan navigasi mandiri tanpa perlu pelatihan ulang

robot
Pembuatan abstrak sedang berlangsung

Apa yang Terjadi

Tim Stanford melakukan sesuatu yang menarik: mengambil model VLA yang sepenuhnya dilatih pada data lengan mekanik tetap, dan menggunakannya untuk menerbangkan drone, mengambil benda. Rencana mereka disebut AirVLA, berbasis π₀ VLA, menambahkan lapisan “pembimbing fisik yang sadar beban” untuk menyesuaikan dengan dinamika penerbangan, dan kemudian menggunakan 3D Gaussian Splatting untuk menghasilkan data sintetis yang melengkapi sampel navigasi.

Apa Angka yang Didapat

  • Tingkat keberhasilan navigasi: 100%
  • Tingkat keberhasilan pengambilan/penempatan: 50%
  • Tingkat keberhasilan tugas panjang multi-langkah: 62%

Intinya: model inti tidak diubah. Ini sangat penting untuk penerapan nyata—melatih ulang sepenuhnya mahal dan lambat.

Mengapa Model Lengan Mekanik Tidak Dapat Terbang Langsung

VLA dalam “memahami skenario + memahami tugas” masih bisa mentransfer lintas platform, tetapi kontrol dinamika tidak dapat langsung dipindahkan:

  • Data lengan mekanik secara default lingkungan tidak banyak bergerak
  • Drone adalah sistem yang kurang didorong, akumulasi kesalahan sangat cepat, bisa jatuh jika tidak hati-hati
  • Hukum fisika dan batasan kontrol di kedua sisi sama sekali berbeda

Bagaimana Mereka Menyelesaikannya

Dua pemikiran inti:

  1. Menambahkan batasan fisik saat inferensi: bukan memasukkan dinamika baru ke dalam model, tetapi memperbaiki secara online sesuai hukum fisika pada tahap output
  2. Menggunakan Gaussian Splatting untuk membuat data navigasi: tidak perlu mengumpulkan data dari drone secara langsung di seluruh dunia

Pendekatan “menambahkan modul ke model dasar, tanpa melatih ulang dari awal secara end-to-end” ini sejalan dengan arah AIR-VLA, DroneVLA, tetapi titik masuknya berbeda.

Siapa yang Diuntungkan

Perusahaan yang melakukan operasi udara (logistik, inspeksi, pencarian dan penyelamatan) mungkin akan tertarik:

  • Tidak perlu mengumpulkan banyak data drone secara khusus
  • Solusi campuran fisika + AI lebih terkendali dalam skenario yang sensitif terhadap keselamatan, tidak seperti kontrol pembelajaran murni yang terasa tidak pasti

Bagaimana Melihat Hal Ini

Dimensi Penilaian
Kepentingan Tinggi
Kategori Penelitian AI, Dinamika Teknologi, Tren Industri

Kesimpulan: Arah ini masih cukup awal. Yang paling relevan adalah tim yang melakukan operasi udara—produsen robot/drone, laboratorium penelitian, penyedia solusi. Perdagangan jangka pendek tidak banyak berarti, tetapi investor jangka panjang dapat memperhatikan titik kunci dari penelitian ke skala.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan