PP-OCRv6 помещает многоязычные модели в один, полностью охватывая от края до облака, отечественный OCR наконец-то начал развиваться

Посмотреть Оригинал
CoinNetwork
Бaidu выпустила PP-OCRv6: модель с десятками миллионов параметров, сравнимая с миллиардными VLM, поддерживающая 50 языков в одном модели
百度飞桨发布PP-OCRv6,新版提供tiny1.5m、small7.7m、medium34.5m三种模型,覆盖边缘、浏览器与云端。
相较v5,检测与识别准确率提升4.6%与5.1%,并将中文、英文、日文及46种拉丁语言聚合到同一模型。
新设计的检测/识别网络引入统一模块与结构重参数化,提升精度并降低算力。
OpenVINO优化下,medium端到端CPU推理最高提升5.2倍,代码已并入PaddleOCR并开源。
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено