Параметры в 5 миллионов — сравнявшись с моделями за миллиард: Baidu PaddleOCR превзошел Tesseract и занял первое место в GitHub OCR

robot
Генерация тезисов в процессе

Сообщение с CoinWires. По данным мониторинга 1M AI News, открытый OCR-инструментарий PaddleOCR от Baidu PaddlePaddle превзошел поддерживаемый Google ветеранский OCR-движок Tesseract (73 200), набрав 73 300 звезд на GitHub, и стал самым популярным OCR-проектом на GitHub по числу звезд. На третьем месте находится MinerU с 57 500 звездами. PaddleOCR был открыт в 2020 году, поддерживает более 100 языков и охватывает более 160 стран и регионов. В последнее время PaddleOCR активно обновляется: выпущенный на прошлой неделе PP-OCRv5 с 5 миллионами параметров достигает точности, сопоставимой с крупными визуально-языковыми моделями с миллиардом параметров на стандартных OCR-бенчмарках; PaddleOCR-VL-1.5 установил рекорд по точности 94,5% на бенчмарке парсинга документов OmniDocBench v1.5.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Горячее на Gate Fun

    Подробнее
  • РК:$2.27KДержатели:2
    0.00%
  • РК:$2.37KДержатели:2
    1.04%
  • РК:$2.24KДержатели:1
    0.00%
  • РК:$2.24KДержатели:1
    0.00%
  • РК:$2.25KДержатели:1
    0.00%
  • Закрепить