Microsoft merilis model agen cerdas kendali komputer dengan 7B parameter pertama, Fara-7B

robot
Pembuatan abstrak sedang berlangsung
AIMPACT Pesan, 16 Mei (UTC+8), Microsoft meluncurkan Fara-7B, model bahasa kecil dengan parameter 7B yang dirancang khusus untuk skenario penggunaan komputer. Model ini menggunakan arsitektur dekoder multimodal, mampu menerima gambar tangkapan layar dan konteks teks, langsung memprediksi rantai pemikiran dan tindakan operasional yang berparameter. Dibangun berdasarkan Qwen 2.5-VL (7B), mendukung panjang konteks 128k, dilatih selama 2,5 hari di 64 GPU H100, dirilis dengan lisensi MIT pada 24 November 2025. Fara-7B dapat memahami input browser melalui tangkapan layar, menggabungkan penalaran internal dan catatan status sejarah untuk memprediksi langkah berikutnya dan parameter (seperti koordinat klik), pelatihan bergantung pada dataset sintetik skala besar. Model ini mampu merencanakan dan melaksanakan tugas tingkat tinggi (seperti memesan restoran, melamar pekerjaan, merencanakan perjalanan, dll). Dalam hal keamanan dan penyesuaian, menggunakan metode pelatihan pasca yang kokoh, memiliki kemampuan pengenalan titik kunci, mampu menolak tujuh jenis tugas yang melanggar kebijakan penggunaan, dan akan menghentikan operasi pada titik-titik penting seperti memasukkan informasi pribadi dan menyelesaikan pembelian. Pengguna dapat melakukan deployment dan interaksi melalui repositori GitHub, vllm, dan alat fara-cli, yang terutama digunakan untuk otomatisasi tugas web. (Sumber: InFoQ)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 8
  • 3
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
AirdropNightwatch
· 5jam yang lalu
Dalam hal otomatisasi browser, rasanya harus bersaing langsung dengan Penggunaan Browser dan Penggunaan Komputer.
Lihat AsliBalas0
MintCondition
· 6jam yang lalu
Automatisasi tugas web, akhirnya tidak perlu lagi menulis sekumpulan selector
Lihat AsliBalas0
SaveABitOnGasFees
· 6jam yang lalu
Berapa proporsi data yang digunakan untuk penyelarasan pasca pelatihan? Makalahnya segera akan dirilis.
Lihat AsliBalas0
GateUser-83c80dd0
· 6jam yang lalu
7B parameter untuk perencanaan agen, ringan tetapi batas kemampuan harus diuji secara nyata
Lihat AsliBalas0
GateUser-bee672a5
· 6jam yang lalu
fara-cli pengalaman deployment menunggu pengujian, semoga tidak seperti beberapa dokumentasi proyek yang buruk
Lihat AsliBalas0
Half-SectionSucculent
· 6jam yang lalu
Prediksi koordinat + rantai pemikiran, kontrol granularitas jauh lebih kuat daripada API teks murni
Lihat AsliBalas0
0xLateCoffee
· 6jam yang lalu
128k konteks + persepsi tangkapan layar, kombinasi ini cukup menarik
Lihat AsliBalas0
CandleChaser
· 6jam yang lalu
Lisensi MIT mendapatkan pujian, 7B bisa dijalankan secara lokal
Lihat AsliBalas0