PP-OCRv6 intègre plusieurs langues dans un seul modèle, du périphérique à la cloud tout est inclus, la reconnaissance optique de caractères nationale commence enfin à prendre son envol

Voir l'original
CoinNetwork
Baidu annonce PP-OCRv6 : des millions de paramètres rivalisent avec des VLM de milliards de paramètres, un seul modèle supporte 50 langues différentes
Baidu飞桨 a publié PP-OCRv6, la nouvelle version proposant trois modèles : tiny1.5m, small7.7m et medium34.5m, couvrant l'edge, le navigateur et le cloud. Par rapport à v5, la précision de détection et de reconnaissance a été améliorée de 4,6 % et 5,1 %, et le modèle intègre le chinois, l'anglais, le japonais ainsi que 46 langues latines dans un seul modèle. Le nouveau réseau de détection/reconnaissance introduit un module unifié et une re-paramétrisation de la structure, améliorant la précision tout en réduisant la consommation de calcul. Optimisé avec OpenVINO, le traitement CPU de bout en bout pour le modèle medium offre une augmentation maximale de 5,2 fois, le code ayant été intégré à PaddleOCR et rendu open source.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé