PaddleOCR перевершує Tesseract і стає провідним проектом OCR на GitHub з 5 мільйонами параметрів

robot
Генерація анотацій у процесі

Згідно з моніторингом 1M AI News, бібліотека інструментів PaddleOCR з відкритим кодом OCR від Baidu випередила давній OCR-движок Google Tesseract: на GitHub у неї 73 300 зірок проти 73 200 у Tesseract, що робить її проєктом OCR із найвищим рейтингом на платформі. Третє місце посідає MinerU — 57 500 зірок. PaddleOCR було відкрито в 2020 році, і воно підтримує понад 100 мов, охоплюючи більше ніж 160 країн та регіонів. Нещодавно PaddleOCR пройшов інтенсивні оновлення: минулого тижня вийшов PP-OCRv5, який має лише 5 мільйонів параметрів і досягає точності, зіставної з точністю візуальних мовних моделей із мільярдними параметрами на стандартних тестах OCR. Додатково, PaddleOCR-VL-1.5 встановив новий рекорд із показником точності 94,5% на бенчмарку для парсингу документів OmniDocBench v1.5.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Популярні активності Gate Fun

    Дізнатися більше
  • Рин. кап.:$2.27KХолдери:2
    0.00%
  • Рин. кап.:$2.37KХолдери:2
    1.04%
  • Рин. кап.:$2.24KХолдери:1
    0.00%
  • Рин. кап.:$2.24KХолдери:1
    0.00%
  • Рин. кап.:$2.25KХолдери:1
    0.00%
  • Закріпити