PP-OCRv6 把多語言塞一個模型裡,邊緣到雲端全包了,國產 OCR 終於支棱起來了

查看原文
币 界 网
百度發布PP-OCRv6:千萬級參數媲美十億級VLM,單模型支持50種語言
百度飛桨發布PP-OCRv6,新版提供tiny1.5m、small7.7m、medium34.5m三種模型,涵蓋邊緣、瀏覽器與雲端。相較v5,檢測與識別準確率提升4.6%與5.1%,並將中文、英文、日文及46種拉丁語言聚合到同一模型。新設計的檢測/識別網絡引入統一模塊與結構重參數化,提升精度並降低算力。OpenVINO優化下,medium端到端CPU推理最高提升5.2倍,代碼已並入PaddleOCR並開源。
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆