PP-OCRv6 把多语言塞一个模型里,边缘到云端全包了,国产 OCR 终于支棱起来了

币 界 网
百度发布PP-OCRv6:千万级参数媲美十亿级VLM,单模型支持50种语言
百度飞桨发布PP-OCRv6,新版提供tiny1.5m、small7.7m、medium34.5m三种模型,覆盖边缘、浏览器与云端。相较v5,检测与识别准确率提升4.6%与5.1%,并将中文、英文、日文及46种拉丁语言聚合到同一模型。新设计的检测/识别网络引入统一模块与结构重参数化,提升精度并降低算力。OpenVINO优化下,medium端到端CPU推理最高提升5.2倍,代码已并入PaddleOCR并开源。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论