PaddleOCR supera a Tesseract para convertirse en el principal proyecto OCR en GitHub con 5 millones de parámetros

robot
Generación de resúmenes en curso

Según el monitoreo de 1M AI News, la biblioteca de herramientas de OCR de código abierto de Baidu, PaddleOCR, ha superado al motor OCR de larga trayectoria de Google, Tesseract, con 73,300 estrellas en GitHub frente a las 73,200 de Tesseract, convirtiéndola en el proyecto de OCR mejor valorado en la plataforma. El tercer clasificado, MinerU, tiene 57,500 estrellas. PaddleOCR se lanzó como código abierto en 2020 y admite más de 100 idiomas, abarcando más de 160 países y regiones. PaddleOCR ha pasado recientemente por actualizaciones intensivas, con el lanzamiento de PP-OCRv5 la semana pasada, que solo tiene 5 millones de parámetros y logra una precisión comparable a la de los modelos de lenguaje visual con miles de millones de parámetros en evaluaciones estándar de OCR. Además, PaddleOCR-VL-1.5 estableció un nuevo récord con una tasa de precisión del 94.5% en el benchmark de análisis de documentos OmniDocBench v1.5.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado