Stanford NLP: Sebagian besar data pelatihan agen cerdas yang dipublikasikan masih terkonsentrasi pada tahap pelatihan setelah pelatihan

robot
Pembuatan abstrak sedang berlangsung
AIMPACT Pesan, 15 Mei (UTC+8), tim NLP Stanford menunjukkan di Twitter bahwa saat ini sebagian besar data pelatihan agen (agentic) yang dipublikasikan masih terutama untuk tahap pasca pelatihan (post-training), terutama untuk model seperti Qwen (model-model ini mungkin telah dilatih pada sejumlah besar data agen). Tim tersebut berpendapat bahwa untuk melatih model sumber terbuka yang baik dari awal, jumlah data agen yang dibutuhkan jauh melebihi apa yang diperlukan hanya dari pelatihan ulang dengan bobot terbuka, yang menyoroti kekurangan data pelatihan agen saat ini pada tahap pra-pelatihan. (Sumber: InFoQ)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 5
  • 8
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
NeonMeltsIceCream
· 6jam yang lalu
Model sumber terbuka ingin mengejar, biaya data Agen selama tahap pra-pelatihan terlalu tinggi, tim kecil tidak mampu membayar.
Lihat AsliBalas0
VineGeometry
· 6jam yang lalu
Sepertinya sekarang semua orang berlomba-lomba melakukan pelatihan pasca, hambatan data pra-pelatihan adalah benteng pertahanan yang sebenarnya.
Lihat AsliBalas0
DexterRamen
· 6jam yang lalu
Qwen disebutkan namanya haha, memang kemampuan Agen dalam open source cukup menonjol.
Lihat AsliBalas0
GateUser-9568ced5
· 6jam yang lalu
Kesenjangan data pra-pelatihan cukup penting, pelatihan ulang pun tidak bisa memperbaiki fondasi.
Lihat AsliBalas0
Can'tSleepWithoutSigningThe
· 6jam yang lalu
Pendapat Stanford ini menarik, perbedaan skala data agen cerdas jauh lebih besar dari yang dibayangkan.
Lihat AsliBalas0
  • Disematkan