据 1M AI News 监测, 百度飞桨开源 OCR 工具库 PaddleOCR 以 73,300 GitHub 星标超越谷歌维护的老牌 OCR 引擎 Tesseract(73,200), 成为 GitHub 上星标最高的 OCR 项目。 排名第三的 MinerU 为 57,500 星标。 PaddleOCR 于 2020 年开源, 支持 100+ 语言,覆盖 160+ 国家和地区。 PaddleOCR 近期密集更新, 上周发布的 PP-OCRv5 仅 500 万参数, 在标准 OCR 基准上达到与十亿参数级视觉语言大模型相当的精度; PaddleOCR-VL-1.5 在文档解析基准 OmniDocBench v1.5 上 以 94.5% 准确率刷新纪录。
500万パラメータで10億規模の大規模モデルを実現:百度PaddleOCRがTesseractを超え、GitHub OCRランキング1位に登場
据 1M AI News 监测,
百度飞桨开源 OCR 工具库 PaddleOCR
以 73,300 GitHub 星标超越谷歌维护的老牌 OCR 引擎 Tesseract(73,200),
成为 GitHub 上星标最高的 OCR 项目。
排名第三的 MinerU 为 57,500 星标。
PaddleOCR 于 2020 年开源,
支持 100+ 语言,覆盖 160+ 国家和地区。
PaddleOCR 近期密集更新,
上周发布的 PP-OCRv5 仅 500 万参数,
在标准 OCR 基准上达到与十亿参数级视觉语言大模型相当的精度;
PaddleOCR-VL-1.5 在文档解析基准 OmniDocBench v1.5 上
以 94.5% 准确率刷新纪录。