PP-OCRv6 coloca múltiplos idiomas em um único modelo, do edge até a nuvem tudo integrado, OCR nacional finalmente começou a se fortalecer

Ver original
CoinNetwork
Baidu lança PP-OCRv6: milhões de parâmetros comparáveis a bilhões de VLM, modelo único suporta 50 idiomas
Baidu飞桨 lançou o PP-OCRv6, cuja nova versão oferece três modelos: tiny1.5m, small7.7m e medium34.5m, cobrindo borda, navegador e nuvem. Em comparação com a versão v5, a precisão de detecção e reconhecimento aumentou 4,6% e 5,1%, respectivamente, e o modelo combina chinês, inglês, japonês e 46 línguas latinas em um único modelo. A nova rede de detecção/reconhecimento introduz um módulo unificado e reparametrização estrutural, melhorando a precisão e reduzindo o consumo de energia computacional. Otimizado com OpenVINO, o desempenho de inferência CPU de ponta a ponta no modo medium aumentou até 5,2 vezes, e o código já foi integrado ao PaddleOCR e aberto ao público.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado