تطلق شركة Tongyi Fun-ASR1.5، مع التركيز على التعرف على اللهجات

robot
إنشاء الملخص قيد التقدم
أخبار ME News، في 20 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة Beating، أصدرت مختبر Tongyi في 20 أبريل نموذج التعرف على الصوت Fun-ASR1.5، وتم إطلاق واجهة برمجة التطبيقات على Alibaba Cloud Balian، وفتح تجربة مباشرة في مجتمع Moka. وذكروا أن هذه النسخة تستخدم نموذجًا واحدًا لتغطية 30 لغة، ونظام اللهجات الصينية السبعة، وأكثر من 20 لهجة إقليمية، ولم تعد تعتمد على نماذج منفصلة لكل لهجة. أظهرت التقييمات الداخلية التي قدمها Tongyi أن معدل الأخطاء في الكلمات في سيناريوهات اللهجات النموذجية انخفض بنسبة 56.2% مقارنة بالنسخة السابقة، وأن دقة 5 لهجات تجاوزت 90%، و15 لهجة تجاوزت 80%. كما تم تخصيص تحسينات خاصة للتعرف على الشعر والأشعار القديمة، وذكرت الشركة أن الدقة على مستوى الأحرف الداخلية بلغت 97%. كل هذه الأرقام تأتي من الاختبارات الذاتية لـ Tongyi، وليست من معايير طرف ثالث. بدأت أصعب اللهجات ذات النطاق الطويل في التعرف على الصوت باللغة الصينية تُدمج ضمن مجموعة القدرات التي يمكن استخدامها مباشرة في التطبيقات التجارية. بالنسبة لسيناريوهات مثل البث التعليمي، وخطوط خدمة الحكومة المحلية، وتنظيم المقابلات، لن يحتاج المدمج إلى فصل مسارات التعرف حسب اللهجات الإقليمية، مما يسهل عملية النشر. (المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت