مليون و500 ألف معلمة تساوي نموذج كبير بقيمة تريليون: باحثة باويدو PaddleOCR تتفوق على Tesseract وتتربع على قمة GitHub OCR

robot
إنشاء الملخص قيد التقدم

وفقًا لرصد 1M AI News، تجاوزت مكتبة أدوات OCR مفتوحة المصدر PaddleOCR التي طورتها بايدو 73,300 نجمة على GitHub، متفوقةً على محرك OCR القديم Tesseract المدعوم من جوجل (73,200)، لتصبح المشروع الأكثر نجومية على GitHub. ويحتل MinerU المركز الثالث بـ 57,500 نجمة. تم إطلاق PaddleOCR كمصدر مفتوح في عام 2020، ويقدم دعمًا لأكثر من 100 لغة، ويغطي أكثر من 160 دولة ومنطقة.

شهدت PaddleOCR تحديثات مكثفة مؤخرًا، حيث أصدرت النسخة PP-OCRv5 الأسبوع الماضي والتي تحتوي على 5 ملايين معلمة، محققة دقة تعادل تلك الموجودة في نماذج اللغات البصرية الضخمة التي تحتوي على مليار معلمة وفقًا لمعايير OCR القياسية؛ كما قامت PaddleOCR-VL-1.5 بتجديد الرقم القياسي بدقة 94.5% على معيار تحليل الوثائق OmniDocBench v1.5.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.27Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.37Kعدد الحائزين:2
    1.04%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • تثبيت