5 millones de parámetros igualan a modelos de mil millones de niveles: Baidu PaddleOCR supera a Tesseract y se posiciona en la cima del OCR en GitHub

robot
Generación de resúmenes en curso

Según el monitoreo de 1M AI News, el conjunto de herramientas de OCR de código abierto PaddleOCR de Baidu Paddle, con 73.300 estrellas en GitHub, superó al motor OCR de larga trayectoria mantenido por Google Tesseract (73.200), convirtiéndose en el proyecto de OCR con más estrellas en GitHub. El MinerU, en el tercer puesto, tiene 57.500 estrellas. PaddleOCR se lanzó como código abierto en 2020, admite más de 100 idiomas y cubre más de 160 países y regiones.

PaddleOCR ha tenido actualizaciones recientes y frecuentes: la PP-OCRv5 publicada la semana pasada, con solo 5 millones de parámetros, alcanza una precisión comparable a la de modelos multimodales de visión y lenguaje a nivel de miles de millones de parámetros en los puntos de referencia estándar de OCR; PaddleOCR-VL-1.5, en el punto de referencia de análisis de documentos OmniDocBench v1.5, actualizó el récord con una precisión del 94,5%.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado