PP-OCRv6 يدمج عدة لغات في نموذج واحد، من الحافة إلى السحابة بشكل كامل، وأخيرًا أصبحت تقنية التعرف الضوئي على الأحرف المحلية قوية ومتطورة

شاهد النسخة الأصلية
CoinNetwork
بيدو تطلق PP-OCRv6: ملايين المعلمات تساوي مليار معلمة من VLM، نموذج واحد يدعم 50 لغة
أطلقت شركة بايدو فيجزان إصدار PP-OCRv6، حيث يوفر الإصدار الجديد ثلاثة نماذج هي tiny1.5m و small7.7m و medium34.5m، وتغطي الحافة والمتصفح والسحابة. مقارنة بالإصدار v5، زادت دقة الكشف والتعرف بنسبة 4.6٪ و 5.1٪ على التوالي، وتم دمج اللغة الصينية والإنجليزية واليابانية و46 لغة لاتينية أخرى في نموذج واحد. أدخلت الشبكة الجديدة للكشف / التعرف وحدة موحدة وإعادة تشكيل الهيكل، مما يحسن الدقة ويقلل من استهلاك الحسابات. مع تحسين OpenVINO، زادت سرعة استنتاج وحدة المعالجة المركزية من النهاية إلى النهاية على مستوى medium حتى 5.2 مرة، وتم دمج الكود في PaddleOCR وفتح مصدره.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت