1M AI Newsによるモニタリングによると、BaiduのオープンソースOCRツールライブラリであるPaddleOCRは、GitHub上のスター数がTesseractより73,300に対して73,200で、長年にわたるGoogleのOCRエンジンであるTesseractを上回り、このプラットフォームで最も評価の高いOCRプロジェクトになった。3位のMinerUは57,500スター。PaddleOCRは2020年にオープンソース化され、100以上の言語に対応しており、160以上の国・地域をカバーしている。PaddleOCRは最近集中的なアップデートを受けており、先週リリースされたPP-OCRv5はパラメータがわずか5百万で、標準的なOCRベンチマークにおいて、billion-parameterのビジュアル言語モデルと同等の精度を達成している。さらに、PaddleOCR-VL-1.5は、ドキュメント解析ベンチマークのOmniDocBench v1.5で94.5%の精度率を記録し、Googleの最先端技術と並ぶ新記録を樹立した。
PaddleOCRはTesseractを上回り、GitHub上で5百万パラメータを持つトップのOCRプロジェクトになりました。
1M AI Newsによるモニタリングによると、BaiduのオープンソースOCRツールライブラリであるPaddleOCRは、GitHub上のスター数がTesseractより73,300に対して73,200で、長年にわたるGoogleのOCRエンジンであるTesseractを上回り、このプラットフォームで最も評価の高いOCRプロジェクトになった。3位のMinerUは57,500スター。PaddleOCRは2020年にオープンソース化され、100以上の言語に対応しており、160以上の国・地域をカバーしている。PaddleOCRは最近集中的なアップデートを受けており、先週リリースされたPP-OCRv5はパラメータがわずか5百万で、標準的なOCRベンチマークにおいて、billion-parameterのビジュアル言語モデルと同等の精度を達成している。さらに、PaddleOCR-VL-1.5は、ドキュメント解析ベンチマークのOmniDocBench v1.5で94.5%の精度率を記録し、Googleの最先端技術と並ぶ新記録を樹立した。