Microsoft merilis model agen cerdas pengendalian komputer dengan 7 miliar parameter pertama, Fara-7B

robot
Pembuatan abstrak sedang berlangsung
AIMPACT Pesan, 16 Mei (UTC+8), Microsoft meluncurkan Fara-7B, ini adalah model bahasa kecil dengan parameter 7B yang dirancang khusus untuk skenario penggunaan komputer.
Model ini menggunakan arsitektur dekoder multimodal, mampu menerima gambar tangkapan layar dan konteks teks, langsung memprediksi rantai pemikiran dan tindakan operasional yang berparameter.
Dibangun berdasarkan Qwen 2.5-VL (7B), mendukung panjang konteks 128k, dilatih selama 2,5 hari di 64 GPU H100, dirilis dengan lisensi MIT pada 24 November 2025.
Fara-7B dapat memahami input browser melalui tangkapan layar, menggabungkan penalaran internal dan pencatatan status sejarah untuk memprediksi langkah berikutnya dan parameter (seperti koordinat klik), pelatihan bergantung pada dataset sintetik besar.
Model ini mampu merencanakan dan melaksanakan tugas tingkat tinggi (seperti memesan restoran, melamar pekerjaan, merencanakan perjalanan, dll).
Dalam hal penyesuaian keamanan, menggunakan metode pelatihan ulang yang kokoh, memiliki kemampuan identifikasi titik kunci, mampu menolak tujuh jenis tugas yang melanggar kebijakan penggunaan, dan akan menghentikan operasi pada titik-titik penting seperti memasukkan informasi pribadi dan menyelesaikan pembelian.
Pengguna dapat melakukan deployment dan interaksi melalui repositori GitHub, vllm, dan alat fara-cli, yang terutama digunakan untuk otomatisasi tugas web.
(Sumber: InFoQ)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 10
  • 3
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
GateUser-16838403
· 9menit yang lalu
Periode pelatihan 2,5 hari, efisiensi Microsoft ini agak menakutkan
Lihat AsliBalas0
GateUser-53a6e1a8
· 4jam yang lalu
Keselamatan yang selaras dapat menolak tugas yang melanggar aturan, ini lebih dapat diandalkan daripada generasi AutoGPT.
Lihat AsliBalas0
TheBluePeony'sProphecy
· 4jam yang lalu
Qwen 2.5-VL dasar yang cukup bagus, tetapi jalur Agen multi-modalnya sangat kompetitif
Lihat AsliBalas0
SeaSaltFlavorAirdrop
· 4jam yang lalu
Dalam bidang otomatisasi web, para penggabung Playwright+LLM akan kehilangan pekerjaan.
Lihat AsliBalas0
GateUser-4bd1cc87
· 4jam yang lalu
Persetujuan MIT mendapatkan pujian, model 7B parameter dapat dijalankan secara lokal
Lihat AsliBalas0
GlassCityAfterTheRain
· 4jam yang lalu
Apakah penyebaran fara-cli mudah? Apakah ada gambar Docker?
Lihat AsliBalas0
GateUser-8da82d63
· 4jam yang lalu
Pelatihan data sintetis lengkap, kemampuan generalisasi diragukan, menunggu pengujian nyata
Lihat AsliBalas0
LateAlphaCourier
· 4jam yang lalu
128k konteks cukup bagi saya untuk memasukkan seluruh halaman web.
Lihat AsliBalas0
AirdropUnderTheNeonBridge
· 4jam yang lalu
Screenshot+teks langsung prediksi koordinat, otomatisasi browser harus berubah drastis
Lihat AsliBalas0
CandleChaser
· 4jam yang lalu
64 kartu H100 latihan dua setengah hari, biaya ini saya tidak bisa hitung lagi
Lihat AsliBalas0
Lihat Lebih Banyak