500万パラメータで10億規模の大規模モデルを実現:百度PaddleOCRがTesseractを超え、GitHub OCRランキング1位に登場

robot
概要作成中

据 1M AI News 监测,
百度飞桨开源 OCR 工具库 PaddleOCR
以 73,300 GitHub 星标超越谷歌维护的老牌 OCR 引擎 Tesseract(73,200),
成为 GitHub 上星标最高的 OCR 项目。
排名第三的 MinerU 为 57,500 星标。
PaddleOCR 于 2020 年开源,
支持 100+ 语言,覆盖 160+ 国家和地区。

PaddleOCR 近期密集更新,
上周发布的 PP-OCRv5 仅 500 万参数,
在标准 OCR 基准上达到与十亿参数级视觉语言大模型相当的精度;
PaddleOCR-VL-1.5 在文档解析基准 OmniDocBench v1.5 上
以 94.5% 准确率刷新纪录。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • 人気の Gate Fun

    もっと見る
  • 時価総額:$2.25K保有者数:0
    0.00%
  • 時価総額:$2.31K保有者数:2
    0.20%
  • 時価総額:$2.28K保有者数:2
    0.16%
  • 時価総額:$2.26K保有者数:1
    0.00%
  • 時価総額:$2.29K保有者数:2
    0.00%
  • ピン