PaddleOCR تتفوق على Tesseract لتصبح أفضل مشروع OCR على GitHub مع 5 ملايين معلمة

robot
إنشاء الملخص قيد التقدم

وفقًا لمتابعة 1M AI News، تجاوزت مكتبة أدوات OCR مفتوحة المصدر الخاصة بـ Baidu، PaddleOCR، محرك OCR طويل الأمد من Google، Tesseract، حيث حققت 73,300 نجمة على GitHub مقابل 73,200 لـ Tesseract، مما يجعلها مشروع OCR الأعلى تقييمًا على المنصة. حصدت MinerU المرتبة الثالثة 57,500 نجمة. تم إتاحة PaddleOCR كمصدر مفتوح في عام 2020 ويدعم أكثر من 100 لغة، ويغطي أكثر من 160 دولة ومنطقة. خضعت PaddleOCR مؤخرًا لتحديثات مكثفة، مع إصدار PP-OCRv5 الأسبوع الماضي، والذي يضم 5 ملايين معلمة فقط ويحقق دقة مماثلة لدقة نماذج اللغات البصرية ذات المليارات من المعلمات على معايير OCR القياسية. بالإضافة إلى ذلك، حققت PaddleOCR-VL-1.5 رقمًا قياسيًا جديدًا بمعدل دقة بلغ 94.5% على معيار تحليل المستندات OmniDocBench v1.5.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.27Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.37Kعدد الحائزين:2
    1.04%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • تثبيت