Tim Yann LeCun mengusulkan metode perencanaan berlapis, meningkatkan kemampuan penalaran jangka panjang dari model dunia JEPA

robot
Pembuatan abstrak sedang berlangsung

Berita ME News, 8 April (UTC+8), baru-baru ini, tim Yann LeCun mengusulkan metode perencanaan berlapis berbasis model dunia potensial dengan berbagai skala waktu, bertujuan mengatasi dua tantangan utama dalam model dunia belajar: akumulasi kesalahan prediksi dalam pengendalian jangka panjang dan pertumbuhan ruang pencarian secara eksponensial. Metode ini mempelajari model dunia potensial pada berbagai skala waktu dan melakukan perencanaan berlapis lintas skala, memungkinkan penalaran jangka panjang sekaligus secara signifikan mengurangi kompleksitas perencanaan saat melakukan penalaran. Kerangka ini dapat berfungsi sebagai modul abstraksi plug-in, cocok untuk berbagai arsitektur model dunia potensial dan bidang aplikasi. Eksperimen menunjukkan bahwa dalam tugas robot non-egois dunia nyata (seperti mengambil dan meletakkan), hanya dengan target akhir yang diberikan, perencanaan berlapis mencapai tingkat keberhasilan 70%, sedangkan model dunia satu lapis hanya 0%. Dalam lingkungan simulasi berbasis fisika (seperti manipulasi dorong dan navigasi labirin), perencanaan berlapis tidak hanya mencapai tingkat keberhasilan yang lebih tinggi, tetapi juga mengurangi waktu perencanaan hingga tiga kali lipat. Metode ini tidak bergantung pada hadiah tugas tertentu atau sub-target eksternal, menunjukkan kemampuan generalisasi yang kuat pada lingkungan dan tugas yang belum pernah dilihat. (Sumber: InFoQ)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan