Era data robot 「Tiga kaki berdiri」 telah tiba, fragmentasi telah menjadi masa lalu

robot
Pembuatan abstrak sedang berlangsung

Robot belajar data masa pertumbuhan yang liar telah berakhir.

Era di mana dataset penuh dengan data yang tersebar dan masing-masing berjalan sendiri-sendiri telah berlalu. Pada pertengahan 2025, ekosistem robot sumber terbuka secara keseluruhan telah membentuk pola “tiga kaki berdiri tegak” yang jelas—Open X-Embodiment (OXE), LeRobot, dan InternData-A1 mendefinisikan tolok ukur nyata untuk model dasar robot saat ini, sementara sebagian besar dataset tunggal sebelum 2023 sudah kehilangan daya saingnya.

Dari Terpisah ke Seragam: Ini Bukan Kebetulan

Melihat evolusi dataset robot di Hugging Face Hub, kita bisa melihat bahwa seluruh industri sedang mengalami pergeseran dari koleksi fragmentasi yang khusus untuk lembaga menuju pola seragam skala besar, standar, dan didorong komunitas.

Perubahan ini bukan kebetulan, juga bukan hasil dorongan paksa dari pihak tertentu. Pada dasarnya, melatih strategi robot umum membutuhkan skala dan standar; dari sudut pandang ekosistem, proyek yang didukung dengan baik dan cocok dengan kerangka kerja utama secara alami lebih mudah menarik pengembang.

Tiga Ekosistem Utama Menunjukkan Keunggulan Masing-masing

OXE: Saatnya ImageNet di bidang robot

Open X-Embodiment adalah kolaborasi yang diluncurkan oleh 34 laboratorium robot terkemuka pada akhir 2023. Ini bukan dataset tunggal, melainkan integrasi besar dari lebih dari 60 dataset yang ada dalam satu arsitektur terpadu.

Data berbicara:

  • Lebih dari 1 juta trajektori dunia nyata
  • 22 jenis bentuk robot berbeda (dari lengan industri hingga robot berkaki empat, lengan bergerak)
  • Semua data diubah ke format standar RLDS berbasis TensorFlow dan Apache Arrow

Pelajaran utama sangat sederhana—operasi sederhana sudah menjadi komoditas. Tugas dasar seperti mengambil dan menaruh, membuka laci, perakitan satu lengan, di tingkat data sudah “terselesaikan”. Ini menandai berakhirnya era menghasilkan uang dari penjualan data operasi jarak jauh dasar. Nilai bisnis di masa depan terletak pada data ahli berpresisi tinggi, operasi jangka panjang di lingkungan rumah nyata, atau data yang langka dan berwujud (berbentuk manusia, perangkat lunak).

LeRobot: Jawaban standar dari kubu PyTorch

Berbeda dari jalur riset Google/TensorFlow yang diwakili oleh OXE, LeRobot dari Hugging Face dengan cepat menjadi standar nyata komunitas sumber terbuka yang lebih luas—terutama bagi penggemar PyTorch.

Kunci dari ekosistem ini adalah tumpukan lengkap: dataset + model + kode pelatihan + alat evaluasi.

Inovasi penyimpanan patut disebutkan: LeRobot Dataset v3.0 menggunakan Apache Parquet + MP4/AV1 terkompresi, efisiensi penyimpanan meningkat 5-10 kali dibanding sebelumnya, dan kecepatan muat juga meningkat secara signifikan.

Dataset unggulan meliputi:

  • DROID 1.0.1: dari lebih dari 50 tim, sekitar 76.000 dataset, dikumpulkan secara sengaja di “lingkungan luar ruangan”, memastikan refleksi perubahan nyata secara maksimal
  • Seri Aloha: data dual lengan dan lengan bergerak berpresisi tinggi

Pelajaran nyata: standar pengiriman data sudah beralih permanen ke Parquet + MP4. Penyedia komersial yang masih menggunakan paket ROS atau video mentah sebenarnya menambah beban teknologi yang tidak perlu bagi pelanggan.

Kebangkitan data sintetis: InternData-A1

Kekuatan ketiga berasal dari data sintetis berperforma tinggi dalam skala besar. InternData-A1 dari Laboratorium AI Shanghai mewakili kemajuan terbaru di bidang ini:

  • Skala: 630.000 trajektori, setara dengan 7.433 jam kerja robot
  • Keanekaragaman fisik: tidak hanya benda kaku, tetapi juga benda berengsel, fluida, partikel, dan bahan yang dapat berubah bentuk (kain, tali, dll)
  • Tumpukan teknologi: mesin fisika canggih + randomisasi domain + rendering realistis optik + pembuatan kursus otomatis

Kesenjangan Realitas: Batas Data Sintetis

Namun, ada titik balik penting—meskipun data sintetis semakin maju, mereka bukan segalanya.

Survei komprehensif bulan Oktober 2025 menemukan bahwa meskipun kemajuan rekayasa signifikan, perbedaan inti antara simulasi dan kenyataan belum hilang, hanya dipadatkan ke bidang yang lebih sempit namun tetap penting.

Tantangan utama meliputi:

Kesenjangan dinamika: bahkan mesin fisika terbaik tahun 2025 pun sulit menangani fenomena chaos, benda yang dapat berubah bentuk, kulit tipis (seperti pola kerutan kain, ingatan lipatan), serta kesalahan akumulasi numerik. Strategi yang berjalan baik di simulasi bisa gagal di tugas kontak padat nyata.

Kesenjangan persepsi dan sensor: meskipun rendering sintetis mencapai tingkat fotorealistik, tetap ada artefak sistematis—model cacat kamera nyata yang tidak akurat, kurangnya scattering subsurface, efek halo, debu, dll.

Kesenjangan kontrol eksekusi: robot nyata memiliki pengontrol tersembunyi yang drift seiring waktu, membutuhkan penyesuaian mikro untuk setiap unit.

Kesenjangan sistem dan lingkungan: pengontrol keamanan, latensi komunikasi, dan kepatuhan lantai yang tidak dimodelkan sulit direplikasi secara akurat dalam simulasi.

Data menunjukkan bahwa model dasar saat ini (RT-2-X, Octo, dll) saat dipindahkan dari simulasi ke robot nyata, tingkat keberhasilannya biasanya menurun 40-80%, dan performa terburuk terjadi pada tugas yang melibatkan benda berengsel, kontak padat, dan jangka panjang.

Faktanya, data nyata belum tergantikan

Meskipun strategi mitigasi seperti randomisasi domain skala besar, residual modeling, pelatihan campuran (90-99% sintetis + 1-10% nyata) menunjukkan kemajuan, garis bawah tahun 2025 adalah: transfer simulasi tanpa kamera tetap terbatas pada tugas rigid body tingkat menengah dan lingkungan terkendali.

Untuk aplikasi yang melibatkan benda berengsel, fluida, perakitan berpresisi tinggi, atau operasi rumah tangga tidak terstruktur, data dunia nyata—terutama data demonstrasi ahli berkualitas tinggi—masih memiliki nilai yang tak tergantikan.

Apa arti ini bagi penyedia data? Peluang bisnis 2026-2028 terletak pada solusi campuran yang menggabungkan data sintetis skala besar dan trajektori nyata pilihan, terutama di bidang “tantangan tinggi” (kain, cairan, lingkungan berantakan, inferensi multi langkah). Data sintetis murni dalam waktu dekat tidak cukup untuk mendukung deployment produksi.

Catatan Penutup: Dari “dataset mana” ke “bagaimana mencampur”

Kedatangan OXE, LeRobot, dan InternData-A1 menandai akhir dari era fragmentasi data belajar robot yang sesungguhnya. Kita sudah memasuki tahap “pasca dataset”, di mana pertanyaan utama bukan lagi “dataset mana yang dipilih”, melainkan:

  • Bagaimana mencampur data nyata, sintetis, dan distilasi secara paling efektif?
  • Bagaimana merancang metadata agar tetap bertahan dalam distilasi model?
  • Fenomena berwujud dan fisika apa yang masih menjadi hambatan utama?

Pemenang 2-3 tahun ke depan akan menjadi mereka yang mampu menghasilkan data berkualitas tinggi, memenuhi standar, dan tetap unggul dalam pengumpulan data nyata di bidang-bidang yang semakin sempit dan menantang.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan

Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)