Stanford NLP: Sebagian besar data pelatihan agen cerdas yang dipublikasikan masih terkonsentrasi pada tahap pelatihan setelah pelatihan

robot
Pembuatan abstrak sedang berlangsung
AIMPACT Pesan, 15 Mei (UTC+8), tim NLP Stanford menunjukkan di Twitter bahwa saat ini sebagian besar data pelatihan agen (agentic) yang dipublikasikan masih terutama untuk tahap pasca-pelatihan (post-training), terutama untuk model seperti Qwen (yang mungkin telah dilatih pada sejumlah besar data agen). Tim tersebut berpendapat bahwa untuk melatih model sumber terbuka yang baik dari awal, jumlah data agen yang dibutuhkan jauh melebihi apa yang diperlukan hanya dari pelatihan ulang dengan bobot terbuka, yang menyoroti kekurangan data pelatihan agen saat ini pada tahap pra-pelatihan. (Sumber: InFoQ)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 12
  • 8
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
SushiAndSlugs
· 4jam yang lalu
Apakah langkah Qwen ini termasuk kemenangan mudah?
Lihat AsliBalas0
FlamingoFacingJudgment
· 5jam yang lalu
Model sumber terbuka ingin menyaingi model tertutup, hambatan data lebih sulit ditembus daripada kekuatan komputasi
Lihat AsliBalas0
ColdLightNftCabinet
· 8jam yang lalu
Komunitas sumber terbuka harus memikirkan bagaimana menggalang dana untuk data pra-pelatihan.
Lihat AsliBalas0
GateUser-a365d15f
· 8jam yang lalu
Rasanya seperti kembali ke cerita lama tentang data sebagai kekuasaan
Lihat AsliBalas0
GateUser-46033407
· 8jam yang lalu
Jumlah data yang dibutuhkan untuk pelatihan dari nol, terdengar sangat menakutkan
Lihat AsliBalas0
PerpNightshift
· 9jam yang lalu
Penelitian ini memberi senjata kepada pihak tertutup.
Lihat AsliBalas0
GateUser-46c777d0
· 9jam yang lalu
Pengamatan Stanford ini sangat tepat, kemampuan agen memang dibangun dari pelatihan berurutan yang kurang optimal.
Lihat AsliBalas0
GlassDomeRoaming
· 9jam yang lalu
Ruang optimalisasi pasca pelatihan selalu memiliki batas, kekurangan pra-pelatihan akan segera terungkap
Lihat AsliBalas0
GateUser-e84f640c
· 9jam yang lalu
Kesimpulan ini cukup menghancurkan bagi tim kecil dan menengah, ambang data semakin tinggi
Lihat AsliBalas0
ExitLiquidityStan
· 9jam yang lalu
Semoga ada yang dapat merilis data agen pra-pelatihan berkualitas tinggi secara sumber terbuka
Lihat AsliBalas0
Lihat Lebih Banyak
  • Disematkan