PP-OCRv6 多言語を一つのモデルに詰め込み、エッジからクラウドまで完全対応、国産OCRがついに本格的に活躍し始めた

原文表示
CoinNetwork
百度がPP-OCRv6を発表:千万レベルのパラメータが10億レベルのVLMに匹敵、単一モデルで50種類の言語をサポート
百度飛桨はPP-OCRv6をリリースし、新しいバージョンではtiny1.5m、small7.7m、medium34.5mの3つのモデルを提供し、エッジ、ブラウザ、クラウドをカバーします。v5と比較して、検出と認識の精度がそれぞれ4.6%、5.1%向上し、中国語、英語、日本語、そして46のラテン語を同じモデルに統合しています。新設計の検出/認識ネットワークは、統一モジュールと構造の再パラメータ化を導入し、精度を向上させ、計算コストを削減します。OpenVINO最適化により、medium端のエンドツーエンドCPU推論は最大5.2倍向上し、コードはPaddleOCRに統合され、オープンソース化されています。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし