Tim NLP Stanford di Twitter menyatakan bahwa data pelatihan agen yang saat ini tersedia secara publik terutama digunakan untuk tahap pelatihan lanjutan, terutama untuk model seperti Qwen. Model-model ini mungkin telah dilatih pada sejumlah besar data agen. Mereka berpendapat bahwa jumlah data agen yang dibutuhkan untuk melatih model sumber terbuka yang berkualitas dari awal jauh melebihi skala pelatihan lanjutan hanya dengan bobot terbuka, menyoroti kekurangan data agen selama tahap pra-pelatihan. Sumber: InFoQ

MeNews

2026-05-20 10:36:37

Pembuatan abstrak sedang berlangsung

AIMPACT Pesan, 15 Mei (UTC+8), tim NLP Stanford menunjukkan di Twitter bahwa saat ini sebagian besar data pelatihan agen (agentic) yang dipublikasikan masih terutama untuk tahap pasca pelatihan (post-training), terutama untuk model seperti Qwen (model-model ini mungkin telah dilatih pada sejumlah besar data agen). Tim tersebut berpendapat bahwa untuk melatih model sumber terbuka yang baik dari awal, jumlah data agen yang dibutuhkan jauh melebihi apa yang diperlukan hanya dari pelatihan ulang dengan bobot terbuka, yang menyoroti kekurangan data pelatihan agen saat ini pada tahap pra-pelatihan. (Sumber: InFoQ)

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

7 Suka

Hadiah
7
5
8
Bagikan

Komentar

Tambahkan komentar

NeonMeltsIceCream

· 6jam yang lalu

Model sumber terbuka ingin mengejar, biaya data Agen selama tahap pra-pelatihan terlalu tinggi, tim kecil tidak mampu membayar.

Lihat AsliBalas0

VineGeometry

· 6jam yang lalu

Sepertinya sekarang semua orang berlomba-lomba melakukan pelatihan pasca, hambatan data pra-pelatihan adalah benteng pertahanan yang sebenarnya.

Lihat AsliBalas0

DexterRamen

· 6jam yang lalu

Qwen disebutkan namanya haha, memang kemampuan Agen dalam open source cukup menonjol.

Lihat AsliBalas0

GateUser-9568ced5

· 6jam yang lalu

Kesenjangan data pra-pelatihan cukup penting, pelatihan ulang pun tidak bisa memperbaiki fondasi.

Lihat AsliBalas0

Can'tSleepWithoutSigningThe

· 6jam yang lalu

Pendapat Stanford ini menarik, perbedaan skala data agen cerdas jauh lebih besar dari yang dibayangkan.

Lihat AsliBalas0

Topik Trending
Lihat Lebih Banyak
#
TradfiTradingChallenge
196.88K Popularitas
#
30YearTreasuryYieldBreaks5%
365.06K Popularitas
#
IsraelStrikesIranBTCPlunges
48.28K Popularitas
#
#DailyPolymarketHotspot
1M Popularitas
#
RWAMarketCapExceeds65Billion
8.76M Popularitas

Disematkan

peta situs

Stanford NLP: Sebagian besar data pelatihan agen cerdas yang dipublikasikan masih terkonsentrasi pada tahap pelatihan setelah pelatihan

Topik Trending

TradfiTradingChallenge

30YearTreasuryYieldBreaks5%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

RWAMarketCapExceeds65Billion

Disematkan