微軟發布首個7B參數計算機操控智能體模型Fara-7B

robot
摘要生成中
AIMPACT 消息,5 月 16 日(UTC+8),微软推出 Fara-7B,这是其首个专为计算机使用场景设计的 7B 参数智能体小语言模型。該模型采用多模态解码器架構,能接收截圖圖像和文本上下文,直接預測帶參數的思維鏈和操作動作。基於 Qwen 2.5-VL(7B)構建,支持 128k 上下文長度,在 64 塊 H100 GPU 上訓練 2.5 天,採用 MIT 許可證於 2025 年 11 月 24 日發布。Fara-7B 通過截圖感知瀏覽器輸入,結合內部推理和歷史狀態記錄預測下一步操作及參數(如點擊座標),訓練依賴大規模全合成數據集。模型能規劃和執行高級任務(如預訂餐廳、申請工作、規劃旅行等)。在安全對齊方面,採用穩健後訓練方法,具備關鍵點識別能力,能拒絕七類違反使用政策的任務,並在輸入個人信息、完成購買等關鍵停止點暫停操作。用戶可通過 GitHub 倉庫、vllm 和 fara-cli 工具進行部署和交互查詢,主要應用於自動化網頁任務。(來源:InFoQ)
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 6
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
翻倍先别急
· 05-27 04:35
fara-cli 直接上手,我等會就試試
查看原文回復0
实干派者
· 05-26 22:35
參數才 7B,推理成本可控,中小團隊也能玩了
查看原文回復0
倒影街角
· 05-26 19:10
7B 跑多模態 Agent,本地部署黨狂喜
查看原文回復0
Yield Tuning Fork
· 05-26 19:03
微軟這波開源格局拉滿了,MIT 授權真香
查看原文回復0
Oracle Skeptic
· 05-26 18:58
全合成數據訓練有點意思,數據閉環玩明白了
查看原文回復0
烤面包的预言家
· 05-26 18:52
基於 Qwen 2.5-VL 構建,國產底座出息了
查看原文回復0