PaddleOCR supera o Tesseract e torna-se o principal projeto OCR no GitHub com 5 milhões de parâmetros

robot
Geração de resumo em curso

De acordo com a monitorização da 1M AI News, a biblioteca de ferramentas de OCR de código aberto da Baidu, PaddleOCR, ultrapassou o motor de OCR há muito tempo estabelecido da Google, Tesseract, com 73.300 estrelas no GitHub, face às 73.200 do Tesseract, tornando-se no projecto de OCR com melhor classificação na plataforma. O terceiro classificado, MinerU, tem 57.500 estrelas. O PaddleOCR foi disponibilizado em código aberto em 2020 e suporta mais de 100 línguas, cobrindo mais de 160 países e regiões. O PaddleOCR passou recentemente por atualizações intensivas, com o lançamento do PP-OCRv5 na semana passada, que tem apenas 5 milhões de parâmetros e atinge uma precisão comparável à de modelos de linguagem visuais com mil milhões de parâmetros em benchmarks de OCR normalizados. Além disso, o PaddleOCR-VL-1.5 estabeleceu um novo recorde com uma taxa de precisão de 94,5% no benchmark de análise de documentos OmniDocBench v1.5.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar