500万パラメータで10億規模の大規模モデルを実現:百度PaddleOCRがTesseractを超え、GitHub OCRランキング1位に登場

robot
概要作成中

Coin界ネットのニュースによると、1M AI Newsのモニタリングで、百度の飛桨がオープンソース化した OCR ツールキット PaddleOCR が、GitHub のスター数 73,300 で、Google が保守する老舗 OCR エンジン Tesseract(73,200)を上回り、GitHub 上でスター数が最も多い OCR プロジェクトになりました。ランキング第3位の MinerU は 57,500 スターです。PaddleOCR は 2020 年にオープンソース化され、100+ の言語をサポートし、160+ の国・地域をカバーしています。PaddleOCR は最近、集中的にアップデートされています。先週リリースされた PP-OCRv5 は 500 万パラメータのみですが、標準 OCR ベンチマークで、10 億パラメータ級のビジョン言語大規模モデルに匹敵する精度に到達しています。さらに、PaddleOCR-VL-1.5 は、ドキュメント解析ベンチマークの OmniDocBench v1.5 で 94.5% の精度を記録し、記録を更新しました。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン