PP-OCRv6 помістив багато мов у одну модель, від краю до хмари — все включено, китайський OCR нарешті почав працювати.

Переглянути оригінал
CoinNetwork
Байду випустила PP-OCRv6: мільйонні параметри, що конкурують із мільярдними VLM, один модель підтримує 50 мов
百度飞桨 випустила PP-OCRv6, нова версія пропонує три моделі: tiny1.5m, small7.7m, medium34.5m, що охоплюють крайові пристрої, браузери та хмару. Порівняно з v5, точність детекції та розпізнавання підвищилася на 4.6% та 5.1%, а також об’єднала китайську, англійську, японську та 46 латинських мов у одну модель. Новий дизайн мережі для детекції/розпізнавання вводить уніфікований модуль та структурну повторну параметризацію, що підвищує точність і зменшує обчислювальні ресурси. За оптимізацією OpenVINO, повний цикл від детекції до розпізнавання на CPU для medium досягає максимального прискорення до 5.2 разів, код вже інтегровано в PaddleOCR і відкритий для спільноти.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено