Coin界ネットのニュースによると、1M AI Newsのモニタリングで、百度の飛桨がオープンソース化した OCR ツールキット PaddleOCR が、GitHub のスター数 73,300 で、Google が保守する老舗 OCR エンジン Tesseract(73,200)を上回り、GitHub 上でスター数が最も多い OCR プロジェクトになりました。ランキング第3位の MinerU は 57,500 スターです。PaddleOCR は 2020 年にオープンソース化され、100+ の言語をサポートし、160+ の国・地域をカバーしています。PaddleOCR は最近、集中的にアップデートされています。先週リリースされた PP-OCRv5 は 500 万パラメータのみですが、標準 OCR ベンチマークで、10 億パラメータ級のビジョン言語大規模モデルに匹敵する精度に到達しています。さらに、PaddleOCR-VL-1.5 は、ドキュメント解析ベンチマークの OmniDocBench v1.5 で 94.5% の精度を記録し、記録を更新しました。
500万パラメータで10億規模の大規模モデルを実現:百度PaddleOCRがTesseractを超え、GitHub OCRランキング1位に登場
Coin界ネットのニュースによると、1M AI Newsのモニタリングで、百度の飛桨がオープンソース化した OCR ツールキット PaddleOCR が、GitHub のスター数 73,300 で、Google が保守する老舗 OCR エンジン Tesseract(73,200)を上回り、GitHub 上でスター数が最も多い OCR プロジェクトになりました。ランキング第3位の MinerU は 57,500 スターです。PaddleOCR は 2020 年にオープンソース化され、100+ の言語をサポートし、160+ の国・地域をカバーしています。PaddleOCR は最近、集中的にアップデートされています。先週リリースされた PP-OCRv5 は 500 万パラメータのみですが、標準 OCR ベンチマークで、10 億パラメータ級のビジョン言語大規模モデルに匹敵する精度に到達しています。さらに、PaddleOCR-VL-1.5 は、ドキュメント解析ベンチマークの OmniDocBench v1.5 で 94.5% の精度を記録し、記録を更新しました。