مليون و500 ألف معلمة تساوي نموذج كبير بقيمة تريليون: باحثة باويدو PaddleOCR تتفوق على Tesseract وتتربع على قمة GitHub OCR

robot
إنشاء الملخص قيد التقدم

موقع CoinJie يُفيد، ووفقًا لمراقبة 1M AI News، تجاوزت مجموعة أدوات OCR مفتوحة المصدر من شركة Baidu، المعروفة باسم PaddleOCR، محرك OCR القديم والمشهور الذي تحافظ عليه شركة Google وهو Tesseract (73,200)، بعدد 73,300 علامة نجمة على GitHub، لتصبح بذلك أعلى مشروع OCR من حيث عدد النجوم على GitHub. ويأتي MinerU في المركز الثالث بـ 57,500 نجمة. تم إطلاق PaddleOCR كمصدر مفتوح في عام 2020، ويدعم أكثر من 100 لغة، ويغطي أكثر من 160 دولة ومنطقة. وقد أجرت PaddleOCR تحديثات متواصلة مؤخرًا؛ إذ حقق الإصدار PP-OCRv5 الذي تم إصداره الأسبوع الماضي، وبعدد 5 ملايين معلمة فقط، دقة مكافئة تمامًا لدقة نماذج اللغة البصرية على مستوى مليار معلمة على معايير OCR القياسية. كما قامت PaddleOCR-VL-1.5 بتحديث الرقم القياسي في معيار تحليل المستندات OmniDocBench v1.5 بدقة بلغت 94.5%.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.27Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.37Kعدد الحائزين:2
    1.04%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • تثبيت