PP-OCRv6 mete múltiples idiomas en un solo modelo, desde el borde hasta la nube todo incluido, la OCR nacional finalmente está empezando a destacar.

Ver original
CoinNetwork
Baidu lanza PP-OCRv6: millones de parámetros que igualan a los mil millones de VLM, un solo modelo soporta 50 idiomas
Baidu PaddlePaddle lanza PP-OCRv6, la nueva versión ofrece tres modelos: tiny1.5m, small7.7m y medium34.5m, cubriendo dispositivos edge, navegadores y la nube. En comparación con v5, la precisión en detección y reconocimiento mejora un 4.6% y un 5.1%, respectivamente, y agrupa chino, inglés, japonés y 46 idiomas latinos en un solo modelo. La red de detección/reconocimiento de diseño nuevo introduce módulos unificados y reparametrización estructural, mejorando la precisión y reduciendo el consumo de computación. Optimizado con OpenVINO, la inferencia CPU de extremo a extremo en el modelo medium aumenta hasta 5.2 veces, y el código ya se ha integrado en PaddleOCR y se ha abierto al público.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado