5 juta parameter menyamai model besar bernilai miliaran: Baidu PaddleOCR melampaui Tesseract dan menduduki puncak GitHub OCR nomor satu

robot
Pembuatan abstrak sedang berlangsung

Berita dari Ji Jie Net: Berdasarkan pemantauan 1M AI News, toolkit alat sumber terbuka OCR dari Baidu, PaddleOCR, telah melampaui mesin OCR legendaris yang dikelola Google, Tesseract, dengan 73.300 bintang GitHub, menjadi proyek OCR dengan bintang tertinggi di GitHub. Tesseract memiliki 73.200 bintang. Peringkat ketiga MinerU memiliki 57.500 bintang. PaddleOCR dibuka untuk umum pada 2020, mendukung lebih dari 100 bahasa, serta mencakup lebih dari 160 negara dan wilayah. PaddleOCR baru-baru ini melakukan pembaruan yang intensif. PP-OCRv5 yang dirilis minggu lalu hanya memiliki 5 juta parameter, namun pada tolok ukur OCR standar mencapai akurasi yang sebanding dengan model bahasa visi skala satu miliar parameter; PaddleOCR-VL-1.5 pada tolok ukur analisis dokumen OmniDocBench v1.5 mencapai rekor baru dengan akurasi 94,5%.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan