Kode murni melawan keras jaringan saraf! Model besar menulis aturan kontrol secara manual masuk ke industri keras, menjalankan seluruh strategi dengan 14 dolar

robot
Pembuatan abstrak sedang berlangsung
AIMPACT Pesan, 19 Mei (UTC+8), menurut pemantauan Beating dari Dongcha, anggota inti pelatihan ulang OpenAI, Ong Jia Yi, baru saja membuktikan bahwa "mengandalkan model besar saja untuk menulis kode bisa menyelesaikan permainan Atari", para peneliti Paul Garnier kemudian mengadaptasi metode ini ke dalam pengendalian mekanika fluida yang lebih keras. Dia sama sekali tidak melatih jaringan saraf apa pun. Hanya membiarkan Codex 5.5 berperan sebagai programmer, mengamati rekaman simulasi fluida dan berulang kali menulis ulang skrip Python. Hanya dengan aturan kendali buatan tangan ini, AI berhasil mengalahkan baseline pembelajaran penguatan (DRL) top dalam lebih dari separuh skenario pengujian fisika. Untuk mengurangi hambatan mobil, menenangkan turbulensi pipa, industri sebelumnya hanya bisa mengandalkan kekuatan komputasi besar, memberi makan model kotak hitam yang tidak bisa dipahami untuk mengendalikan katup aliran udara. Codex menghindari jalan buntu ini. Aturannya yang dibuat sangat langsung, misalnya "ketika kelengkungan lokal terlalu besar, tunda penyemprotan". Puluhan baris kode singkat yang mengandung pengetahuan fisika ini langsung menggantikan trial-and-error brutal tanpa pikiran dari jaringan saraf. Mengganti kotak hitam dengan kode, menghilangkan jebakan jaringan saraf yang kaku dan mudah pecah saat disentuh. Sebelumnya, jika perangkat keras sedikit diubah (misalnya mengubah jumlah nosel dari 5 menjadi 10), model lama langsung menjadi usang dan harus dilatih ulang dengan biaya lagi. Sekarang, cukup mengubah konstanta dalam kode, sistem bisa langsung terhubung ke perangkat baru. Ketika waktu pengujian dipaksa diperpanjang empat kali lipat, model DRL tradisional yang keluar dari zona pengalaman benar-benar runtuh; tetapi kode yang ditulis oleh model besar tetap stabil karena langsung mengikuti logika fisika. Untuk menjalankan seluruh strategi kendali ini, model besar hanya menghabiskan 21,25 juta Token, dengan biaya kurang dari 14 dolar. (Sumber: BlockBeats)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan