PP-OCRv6 coloca múltiplos idiomas num único modelo, do edge à nuvem tudo integrado, OCR nacional finalmente começa a ganhar força

Ver original
CoinNetwork
Baidu lança PP-OCRv6: milhões de parâmetros comparáveis a VLM de bilhões de parâmetros, modelo único suporta 50 idiomas
Baidu PaddlePaddle lançou o PP-OCRv6, cuja nova versão oferece três modelos: tiny1.5m, small7.7m e medium34.5m, cobrindo borda, navegador e nuvem. Em comparação com a versão v5, a precisão de deteção e reconhecimento aumentou 4,6% e 5,1%, respectivamente, e o modelo combina chinês, inglês, japonês e 46 línguas latinas na mesma arquitetura. A nova rede de deteção/reconhecimento introduz um módulo unificado e reparametrização estrutural, melhorando a precisão e reduzindo o consumo de energia computacional. Otimizado com OpenVINO, o inferência CPU de ponta a ponta no modo medium apresenta até 5,2 vezes de aumento de desempenho, e o código já foi integrado ao PaddleOCR e disponibilizado como código aberto.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado