5 milhões de parâmetros para igualar modelos de 10 bilhões de parâmetros: Baidu PaddleOCR supera Tesseract e conquista o topo do GitHub OCR

robot
Geração de resumo em curso

Notícia do Coin World: de acordo com a monitorização da 1M AI News, a biblioteca de ferramentas OCR de código aberto da Baidu, PaddleOCR, ultrapassou o motor OCR clássico mantido pelo Google, o Tesseract (73.200), com 73.300 estrelas no GitHub, tornando-se o projeto de OCR com mais estrelas no GitHub. O MinerU, em terceiro lugar, tem 57.500 estrelas. A PaddleOCR foi lançada em código aberto em 2020, suporta mais de 100 línguas e cobre mais de 160 países e regiões. A PaddleOCR tem vindo a receber atualizações frequentes recentemente: a PP-OCRv5 lançada na semana passada, com apenas 5 milhões de parâmetros, atinge uma precisão comparável à de modelos de linguagem visual em escala de mil milhões de parâmetros nos benchmarks padrão de OCR; a PaddleOCR-VL-1.5, no benchmark de análise de documentos OmniDocBench v1.5, atualizou o recorde com uma taxa de acerto de 94,5%.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar