PP-OCRv6 memasukkan banyak bahasa ke dalam satu model, dari edge hingga cloud semuanya terintegrasi, OCR domestik akhirnya mulai berkembang

Lihat Asli
CoinNetwork
Baidu merilis PP-OCRv6: parameter jutaan tingkat yang setara dengan VLM sepuluh miliar tingkat, model tunggal mendukung 50 bahasa
Baidu飞桨 merilis PP-OCRv6, versi baru menawarkan tiga model yaitu tiny1.5m, small7.7m, dan medium34.5m, mencakup edge, browser, dan cloud. Dibandingkan v5, akurasi deteksi dan pengenalan meningkat sebesar 4.6% dan 5.1%, serta menggabungkan bahasa Mandarin, Inggris, Jepang, dan 46 bahasa Latin ke dalam satu model. Desain baru jaringan deteksi/pengenalan memperkenalkan modul seragam dan reparameterisasi struktur, meningkatkan akurasi dan mengurangi daya komputasi. Dengan optimisasi OpenVINO, inferensi CPU end-to-end pada medium meningkat hingga 5.2 kali, kode telah digabungkan ke PaddleOCR dan dirilis sebagai open source.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan