5 juta parameter menyamai model besar bernilai miliaran: Baidu PaddleOCR melampaui Tesseract dan menduduki puncak GitHub OCR nomor satu

robot
Pembuatan abstrak sedang berlangsung

Menurut pemantauan 1M AI News, perpustakaan alat OCR sumber terbuka Baidu PaddleOCR dengan 73.300 bintang GitHub telah melampaui mesin OCR klasik Tesseract yang dikelola Google (73.200), menjadikannya proyek OCR dengan bintang terbanyak di GitHub. MinerU yang menduduki peringkat ketiga memiliki 57.500 bintang. PaddleOCR dirilis sebagai sumber terbuka pada tahun 2020, mendukung lebih dari 100 bahasa, mencakup lebih dari 160 negara dan wilayah.

PaddleOCR baru-baru ini diperbarui secara intensif, dengan PP-OCRv5 yang dirilis minggu lalu hanya memiliki 5 juta parameter, mencapai akurasi yang setara dengan model bahasa visual berskala miliaran parameter di benchmark OCR standar; PaddleOCR-VL-1.5 memecahkan rekor dengan akurasi 94,5% di benchmark pemrosesan dokumen OmniDocBench v1.5.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan