Prime Intellect lingkungan agen cerdas sumber terbuka yang dapat berevolusi sendiri: Membuat AI "bermusuhan" untuk menghasilkan lebih dari 8000 alat pengujian

AIMPACT Pesan, 19 Mei (UTC+8), menurut pemantauan Beating dari Dongcha, Prime Intellect mengumumkan lingkungan pelatihan agen cerdas sumber terbuka general-agent, yang merupakan lingkungan sintetis yang dapat berevolusi sendiri. Peluncuran ini berfokus pada mengubah penetapan tugas menjadi sebuah permainan dua pemain: oleh sintetis dan solver bergantian berkompetisi, saat ini telah secara otomatis membangun basis data status besar yang berisi 4504 tugas dan lebih dari 8000 alat unik. Kerangka kerja ini dimulai dari tugas benih sederhana, melalui sembilan strategi termasuk pembatasan kondisi, instruksi bising, dan kopling antar entitas, membagi tugas menjadi lima tingkat kesulitan dari t0 hingga t4. Sintetis bertanggung jawab merancang tugas yang dilengkapi basis data, alat interaktif, dan fungsi verifikasi, sementara solver bertugas mencoba menyelesaikan. Hanya tugas dengan tingkat keberhasilan dalam rentang tingkat kesulitan tertentu yang akan dipertahankan, dan tingkat paling sulit akan digunakan sebagai benih untuk evolusi berikutnya. Pengujian resmi menunjukkan bahwa hanya dengan menggunakan lingkungan ini untuk mensintesis lebih dari 4400 trajektori dan melakukan fine-tuning pada model 30B parameter, tingkat akurasi panggilan alat dalam pengujian BFCL meningkat dari 18,9% menjadi 52,3%. Mekanisme ini memungkinkan model lepas dari ketergantungan pada dataset statis yang diberi anotasi secara manual. Melalui permainan langsung antar model, sistem dapat secara terus-menerus menghasilkan data pelatihan yang dapat dikendalikan tingkat kesulitannya dan mengandung verifikasi semantik secara otomatis. (Sumber: BlockBeats)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan