5 milhões de parâmetros para igualar modelos de 10 bilhões de parâmetros: Baidu PaddleOCR supera Tesseract e conquista o topo do GitHub OCR

robot
Geração de resumo em curso

据 1M AI News 监测,
百度飞桨开源 OCR 工具库 PaddleOCR
以 73,300 GitHub 星标超越谷歌维护的老牌 OCR 引擎 Tesseract(73,200),
成为 GitHub 上星标最高的 OCR 项目。
排名第三的 MinerU 为 57,500 星标。
PaddleOCR 于 2020 年开源,
支持 100+ 语言,覆盖 160+ 国家和地区。

PaddleOCR 近期密集更新,
上周发布的 PP-OCRv5 仅 500 万参数,
在标准 OCR 基准上达到与十亿参数级视觉语言大模型相当的精度;
PaddleOCR-VL-1.5 在文档解析基准 OmniDocBench v1.5 上
以 94.5% 准确率刷新纪录。

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar