Hugging Face Membuka Sumber ml-intern, Agen Riset ML untuk Membaca Makalah Otomatis, Pemilihan Data, dan Pelatihan

Menurut pemantauan oleh Dongcha Beating, Hugging Face telah merilis sumber terbuka ml-intern, sebuah agen riset ML yang mampu menyelesaikan secara otomatis seluruh proses “membaca makalah, mengatur dataset, memulai pelatihan GPU, mengevaluasi hasil, dan melakukan iterasi perbaikan.” Proyek ini dibangun di atas kerangka kerja smolagents mereka sendiri dan menawarkan akses CLI serta berbasis web, dengan kode tersedia di GitHub. Rangkaian alat dari ml-intern dibangun di sekitar ekosistem Hugging Face: ia mengambil makalah dari arXiv dan HF Papers serta melakukan pembacaan mendalam mengikuti rantai kutipan; ia menjelajah dataset di HF Hub, memeriksa kualitasnya, merombak formatnya, dan kemudian memasukkannya untuk pelatihan; ketika tidak ada GPU lokal, ia dapat memanggil HF Jobs untuk memulai tugas pelatihan cloud, secara otomatis membaca output evaluasi, mendiagnosis alasan kegagalan, dan menjalankan ulang setelah pelatihan selesai. Secara default, ia menggunakan Claude Sonnet 4.5 untuk menggerakkan loop pengambilan keputusan, dengan maksimum 300 iterasi per jalur dan kompresi otomatis dari konteks yang melebihi 170k token. Hugging Face menyediakan tiga studi kasus dalam posting rilis mereka. Dalam tugas penalaran ilmiah, agen mengidentifikasi dataset OpenScience dan NemoTron-CrossThink dari rantai kutipan makalah tolok ukur, menyaring tujuh varian dari ARC, SciQ, dan MMLU berdasarkan tingkat kesulitan, dan menjalankan 12 putaran SFT pada Qwen3-1.7B, meningkatkan skor GPQA dari 10% menjadi 32% dalam waktu kurang dari 10 jam. Dalam skenario medis, agen menentukan bahwa kualitas dataset yang ada tidak cukup dan secara otomatis menulis skrip untuk menghasilkan 1.100 data sintetis, memperluas dataset sebanyak 50 kali untuk pelatihan, melampaui Codex lebih dari 60% di HealthBench. Dalam skenario matematika kompetitif, agen secara mandiri menulis skrip pelatihan GRPO dan memulai pelatihan di A100 melalui HF Spaces, mengamati kolapsnya imbalan dan melakukan eksperimen ablation untuk menyelidiki penyebabnya.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan