Microsoft merilis model agen cerdas pengendalian komputer dengan 7 miliar parameter pertama, Fara-7B

robot
Pembuatan abstrak sedang berlangsung
AIMPACT Pesan, 16 Mei (UTC+8), Microsoft meluncurkan Fara-7B, model bahasa kecil dengan parameter 7B yang dirancang khusus untuk skenario penggunaan komputer. Model ini menggunakan arsitektur dekoder multimodal, mampu menerima gambar tangkapan layar dan konteks teks, langsung memprediksi rantai pemikiran dan tindakan operasional yang berparameter. Dibangun berdasarkan Qwen 2.5-VL (7B), mendukung panjang konteks 128k, dilatih selama 2,5 hari di 64 GPU H100, dirilis dengan lisensi MIT pada 24 November 2025. Fara-7B dapat memahami input browser melalui tangkapan layar, menggabungkan inferensi internal dan catatan status sejarah untuk memprediksi langkah berikutnya dan parameter (seperti koordinat klik), pelatihan bergantung pada dataset sintetik besar secara keseluruhan. Model ini mampu merencanakan dan melaksanakan tugas tingkat tinggi (seperti memesan restoran, melamar pekerjaan, merencanakan perjalanan, dll). Dalam hal penyesuaian keamanan, menggunakan metode pelatihan pasca yang kokoh, memiliki kemampuan pengenalan titik kunci, mampu menolak tujuh jenis tugas yang melanggar kebijakan penggunaan, dan berhenti saat memasukkan informasi pribadi, menyelesaikan pembelian, dan titik berhenti penting lainnya. Pengguna dapat melakukan penyebaran dan interaksi melalui repositori GitHub, vllm, dan alat fara-cli, yang terutama digunakan untuk otomatisasi tugas web. (Sumber: InFoQ)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 7
  • 3
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
BoredInBlockspace
· 16menit yang lalu
128k konteks memang cukup untuk otomatisasi web, tugas alur panjang tidak takut lupa konteks sebelumnya
Lihat AsliBalas0
MintConditionHuman
· 6jam yang lalu
Lini otomatisasi browser semakin kompetitif, setelah AutoGPT ada lagi yang bisa bersaing
Lihat AsliBalas0
BlocktimeBarista
· 7jam yang lalu
Perkiraan koordinat ini cukup penting, sebelumnya banyak model dalam penentuan posisi elemen sangat mengesankan
Lihat AsliBalas0
RugCheckSkeptic
· 7jam yang lalu
Apakah model yang dilatih menggunakan data sintetis lengkap akan mengalami kegagalan saat diterapkan pada halaman nyata yang kompleks?
Lihat AsliBalas0
QuietValidator
· 7jam yang lalu
Lisensi MIT mendapatkan pujian, akhirnya tidak perlu lagi melihat ketentuan pembatasan komersial itu
Lihat AsliBalas0
ColdWalletUnderTheNeonLights
· 7jam yang lalu
Bagaimana pengalaman deploy menggunakan fara-cli? Ada saudara yang sudah mencobanya, ceritakan apakah ada kendala atau masalah yang ditemui
Lihat AsliBalas0
LateBlockLarry
· 7jam yang lalu
64 blok H100 latihan 2,5 hari, efisiensinya cukup bagus, data sintetis berperan besar
Lihat AsliBalas0