Tim NLP Stanford di Twitter menyatakan bahwa data pelatihan agen yang saat ini tersedia secara umum terutama digunakan untuk tahap pelatihan lanjutan, terutama untuk model seperti Qwen. Model-model ini mungkin telah dilatih pada sejumlah besar data agen. Mereka berpendapat bahwa jumlah data agen yang dibutuhkan untuk melatih model sumber terbuka yang berkualitas dari awal jauh melebihi skala pelatihan lanjutan hanya dengan bobot terbuka, menyoroti kekurangan data agen selama tahap pra-pelatihan. Sumber: InFoQ

MeNews

2026-05-20 10:53:07

Pembuatan abstrak sedang berlangsung

AIMPACT Pesan, 15 Mei (UTC+8), tim NLP Stanford menunjukkan di Twitter bahwa saat ini sebagian besar data pelatihan agen (agentic) yang dipublikasikan masih terutama untuk tahap pasca-pelatihan (post-training), terutama untuk model seperti Qwen (yang mungkin telah dilatih pada sejumlah besar data agen). Tim tersebut berpendapat bahwa untuk melatih model sumber terbuka yang baik dari awal, jumlah data agen yang dibutuhkan jauh melebihi apa yang diperlukan hanya dari pelatihan ulang dengan bobot terbuka, yang menyoroti kekurangan data pelatihan agen saat ini pada tahap pra-pelatihan. (Sumber: InFoQ)

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

8 Suka

Hadiah
8
12
8
Bagikan

Komentar

Tambahkan komentar

SushiAndSlugs

· 4jam yang lalu

Apakah langkah Qwen ini termasuk kemenangan mudah?

Lihat AsliBalas0

FlamingoFacingJudgment

· 5jam yang lalu

Model sumber terbuka ingin menyaingi model tertutup, hambatan data lebih sulit ditembus daripada kekuatan komputasi

Lihat AsliBalas0

ColdLightNftCabinet

· 8jam yang lalu

Komunitas sumber terbuka harus memikirkan bagaimana menggalang dana untuk data pra-pelatihan.

Lihat AsliBalas0

GateUser-a365d15f

· 8jam yang lalu

Rasanya seperti kembali ke cerita lama tentang data sebagai kekuasaan

Lihat AsliBalas0

GateUser-46033407

· 8jam yang lalu

Jumlah data yang dibutuhkan untuk pelatihan dari nol, terdengar sangat menakutkan

Lihat AsliBalas0

PerpNightshift

· 9jam yang lalu

Penelitian ini memberi senjata kepada pihak tertutup.

Lihat AsliBalas0

GateUser-46c777d0

· 9jam yang lalu

Pengamatan Stanford ini sangat tepat, kemampuan agen memang dibangun dari pelatihan berurutan yang kurang optimal.

Lihat AsliBalas0

GlassDomeRoaming

· 9jam yang lalu

Ruang optimalisasi pasca pelatihan selalu memiliki batas, kekurangan pra-pelatihan akan segera terungkap

Lihat AsliBalas0

GateUser-e84f640c

· 9jam yang lalu

Kesimpulan ini cukup menghancurkan bagi tim kecil dan menengah, ambang data semakin tinggi

Lihat AsliBalas0

ExitLiquidityStan

· 9jam yang lalu

Semoga ada yang dapat merilis data agen pra-pelatihan berkualitas tinggi secara sumber terbuka

Lihat AsliBalas0

Lihat Lebih Banyak

Topik Trending
Lihat Lebih Banyak
#
TradfiTradingChallenge
200.69K Popularitas
#
30YearTreasuryYieldBreaks5%
366.61K Popularitas
#
IsraelStrikesIranBTCPlunges
48.28K Popularitas
#
#DailyPolymarketHotspot
1M Popularitas
#
RWAMarketCapExceeds65Billion
8.76M Popularitas

Disematkan

peta situs

Stanford NLP: Sebagian besar data pelatihan agen cerdas yang dipublikasikan masih terkonsentrasi pada tahap pelatihan setelah pelatihan

Topik Trending

TradfiTradingChallenge

30YearTreasuryYieldBreaks5%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

RWAMarketCapExceeds65Billion

Disematkan