5 millones de parámetros igualan a modelos de mil millones de niveles: Baidu PaddleOCR supera a Tesseract y se posiciona en la cima del OCR en GitHub

2026-03-30 09:47:56

Generación de resúmenes en curso

Noticias de CoinJie.com: según el seguimiento de 1M AI News, el conjunto de herramientas de OCR de código abierto PaddleOCR, basado en el framework open source de Baidu “PaddlePaddle”, superó al motor OCR clásico y mantenido por Google Tesseract (73,200) con 73,300 estrellas en GitHub, convirtiéndose en el proyecto de OCR con más estrellas en GitHub. El tercer lugar lo ocupa MinerU con 57,500 estrellas. PaddleOCR se abrió en 2020, admite más de 100 idiomas y cubre 160+ países y regiones. PaddleOCR ha estado actualizándose de forma intensa recientemente: la PP-OCRv5 publicada la semana pasada, con solo 5 millones de parámetros, logra una precisión comparable a la de modelos multimodales de visión y lenguaje de nivel de mil millones de parámetros en benchmarks estándar de OCR; PaddleOCR-VL-1.5, en el benchmark de análisis de documentos OmniDocBench v1.5, actualizó el récord con una precisión del 94.5%.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.