Insinyur AI Tesla: Penyempurnaan algoritma bukanlah obat mujarab, kualitas data menentukan batas AI

robot
Pembuatan abstrak sedang berlangsung
Berita dari Coinjie.com, Kepala Insinyur AI Tesla Cai Yunda menunjukkan bahwa orang sering mengira 99% dari pekerjaan proyek pembelajaran mesin adalah menjalankan pelatihan, padahal waktu yang benar-benar digunakan untuk pelatihan parameter model hanya sekitar 2%. Sebaliknya, 50% tenaga dihabiskan untuk evaluasi pengujian, 40% untuk pembersihan data, dan 8% lagi untuk integrasi sistem. Cai Yunda menekankan bahwa pembersihan data dan evaluasi menentukan batas maksimal yang dapat dipelajari AI. Jika data asli memiliki definisi yang kabur atau label yang bertentangan sebelum dan sesudah, maka akan memperkenalkan noise dari sumbernya. Tidak ada sihir algoritma atau teknik tuning parameter yang dapat menghilangkan background noise, karena model tidak dapat memperbaiki kesalahan buku pelajaran sendiri, dan batas akurasi akhirnya sepenuhnya bergantung pada jumlah informasi efektif dalam data itu sendiri. Untuk memastikan standar data yang seragam dari sumbernya, Cai Yunda mengatakan bahwa dirinya setiap hari meninjau kembali definisi konsep data dan sistem klasifikasi, bahkan harus memeriksa ulang label historis secara berulang. Banyak praktisi setuju dan menunjukkan bahwa baik pengaturan aturan pembelajaran penguatan maupun pelabelan presisi dalam penyempurnaan model, yang menentukan performa AI selalu adalah kualitas data dan tingkat evaluasi, bukan arsitektur model itu sendiri.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 5
  • 1
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
GateUser-e4351615
· 5jam yang lalu
50% penilaian proporsi sistem verifikasi lebih penting daripada pembuatan pil ajaib
Lihat AsliBalas0
MemeFisher
· 5jam yang lalu
Jadi jangan hanya memuji jumlah parameter saja, mari terlebih dahulu menyatukan standar penandaan.
Lihat AsliBalas0
GateUser-470bc925
· 5jam yang lalu
Kualitas data memang benar-benar batas tertinggi
Lihat AsliBalas0
Lemon-FlavoredLiquidation
· 5jam yang lalu
8% integrasi sistem... Tampaknya penerapan adalah lubang besar yang tersembunyi
Lihat AsliBalas0
EchoesOfMistValley
· 5jam yang lalu
Definisi data asli yang kabur memang masalah umum di industri ini, setelah desain tingkat atas tidak dilakukan dengan baik, semuanya akan berutang kembali
Lihat AsliBalas0
  • Disematkan