Microsoft merilis model agen cerdas pengendalian komputer dengan 7 miliar parameter pertama, Fara-7B

robot
Pembuatan abstrak sedang berlangsung
AIMPACT Pesan, 16 Mei (UTC+8), Microsoft meluncurkan Fara-7B, ini adalah model bahasa kecil dengan parameter 7B yang dirancang khusus untuk skenario penggunaan komputer. Model ini menggunakan arsitektur dekoder multimodal, mampu menerima gambar tangkapan layar dan konteks teks, langsung memprediksi rantai pemikiran dan tindakan operasional yang berparameter. Dibangun berdasarkan Qwen 2.5-VL (7B), mendukung panjang konteks 128k, dilatih selama 2,5 hari di 64 GPU H100, dirilis dengan lisensi MIT pada 24 November 2025. Fara-7B dapat memahami input browser melalui tangkapan layar, menggabungkan penalaran internal dan catatan status sejarah untuk memprediksi langkah berikutnya dan parameter (seperti koordinat klik), pelatihan bergantung pada dataset sintetik besar secara keseluruhan. Model ini mampu merencanakan dan melaksanakan tugas tingkat tinggi (seperti memesan restoran, melamar pekerjaan, merencanakan perjalanan, dll). Dalam hal penyelarasan keamanan, menggunakan metode pelatihan pasca yang kokoh, memiliki kemampuan pengenalan titik kunci, mampu menolak tujuh jenis tugas yang melanggar kebijakan penggunaan, dan berhenti saat memasukkan informasi pribadi, menyelesaikan pembelian, dan titik berhenti penting lainnya. Pengguna dapat melakukan penyebaran dan interaksi melalui repositori GitHub, vllm, dan alat fara-cli, yang terutama digunakan untuk otomatisasi tugas web. (Sumber: InFoQ)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 5
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Pragmatists
· 3jam yang lalu
Parameter hanya 7B, biaya inferensi dapat dikendalikan, tim kecil hingga menengah juga bisa bermain.
Lihat AsliBalas0
ReflectionsOnTheStreetCorner
· 6jam yang lalu
7B Agen Multi-modality berjalan, penggemar deployment lokal sangat gembira
Lihat AsliBalas0
YieldTuningFork
· 6jam yang lalu
Microsoft kali ini dalam pola open source benar-benar maksimal, lisensi MIT benar-benar menarik
Lihat AsliBalas0
OracleSkeptic
· 6jam yang lalu
Pelatihan data sintetis lengkap cukup menarik, memahami siklus data dengan baik
Lihat AsliBalas0
TheProphetOfToast
· 6jam yang lalu
Dibangun berdasarkan Qwen 2.5-VL, fondasi domestik menunjukkan kemajuan
Lihat AsliBalas0