Liquid AI開源小體量多模態模型:在端側直接將圖片提取為JSON結構化數據

robot
摘要生成中
據動察 Beating 監測,Liquid AI 開源了兩款小體量多模態模型 LFM2.5-VL-1.6B-Extract 與 LFM2.5-VL-450M-Extract。新模型專門針對圖像結構化數據提取進行了優化,能夠根據用戶指定的字段列表,直接在設備端將圖片轉換為 JSON 格式的數據,省去了傳統多模態模型生成全文後再進行二次解析的步驟。

新模型提供 16 億(1.6B)與 4.5 億(450M)兩種參數規格,採用 LFM Open License v1.0 協議發布。官方評測顯示,新模型在文檔掃描、車載客艙理解及工業檢測等場景中表現優異。在基準評測中,1.6B 模型性能可抗衡 40 億(4B)級別的通用多模態模型,450M 模型則可媲美 20 億(2B)級別模型。

在部署層面,新模型針對各類智能硬件與邊緣設備芯片(SoC)進行了適配,可在車載客艙理解、文檔掃描和工業檢測等端側場景中進行離線部署。Liquid AI 現已在 Hugging Face 平台開放了模型權重的下載。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆