微軟開源創新框架:可將DeepSeek,變成AI Agent

robot
摘要生成中

金十數據2月17日訊,微軟在官網發佈了視覺Agent解析框架OmniParser最新版本V2.0,可將DeepSeek-R1、GPT-4o、Qwen-2.5VL等模型,變成可在計算機使用的AI Agent。與V1版本相比,V2在檢測較小的可交互UI元素時準確率更高、推理速度更快,延遲降低了60%。在高分辨率Agent基準測試ScreenSpot Pro中,V2+GPT-4o的準確率達到了驚人的39.6%,而GPT-4o原始準確率只有0.8%,整體提升非常大。除了V2,微軟還開源了omnitool,這是一個基於Docker的 Windows 系統,涵蓋屏幕理解、定位、動作規劃和執行等功能,也是將大模型變成Agent的關鍵工具。

查看原文
本頁面內容僅供參考,非招攬或要約,也不提供投資、稅務或法律諮詢。詳見聲明了解更多風險披露。
  • 讚賞
  • 4
  • 分享
留言
0/400
GateUser-d6ca73f1vip
· 02-23 07:30
能上现货区么
回復0
GateUser-50c1e0ddvip
· 02-17 03:19
牛市 🐂
回復0
GateUser-50c1e0ddvip
· 02-17 02:39
牛市 🐂
回復0
Mmhreyan8513vip
· 02-17 00:26
猿类入场 🚀牛市 🐂HODL 紧 💪1000倍的感觉 🤑1000倍的感觉 🤑HODL 紧 💪牛市 🐂猿类入场 🚀
回復0
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)