تطلق Tongyi Fun-ASR1.5، مع التركيز على التعرف على اللهجات

robot
إنشاء الملخص قيد التقدم
أخبار ME، في 20 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 动察 Beating، أصدرت مختبرات 通义 في 20 أبريل نموذج التعرف على الصوت Fun-ASR1.5، وتم إطلاقه على واجهة برمجة التطبيقات API على منصة 阿里云百炼، وفتح تجربة مباشرة في مجتمع 魔搭. وذكروا رسميًا أن هذه النسخة تغطي نموذجًا واحدًا 30 لغة، وسبع لهجات رئيسية للغة الصينية و أكثر من 20 لهجة إقليمية، ولم تعد تعتمد على نماذج منفصلة حسب اللهجة. أظهرت التقييمات الداخلية التي قدمتها 通义 أن معدل الأخطاء في الكلمات في سيناريوهات اللهجات النموذجية انخفض بنسبة 56.2% مقارنة بالنسخة السابقة، وأن دقة خمس لهجات تجاوزت 90%، و15 لهجة تجاوزت 80%. كما تم تخصيص تحسينات خاصة للتعرف على الأشعار القديمة، وذكرت المصادر أن الدقة على مستوى الأحرف الداخلية بلغت 97%. كل هذه الأرقام تأتي من الاختبارات الذاتية لـ 通义، وليست من معايير طرف ثالث. بدأت اللهجات ذات التردد الطويل والأصعب في التعرف في مجال التعرف على الصوت باللغة الصينية تُدمج ضمن مجموعة القدرات التي يمكن استخدامها مباشرة في التطبيقات التجارية. بالنسبة لسيناريوهات مثل البث التعليمي، وخطوط خدمة الحكومة المحلية، وتنظيم المقابلات، لن يحتاج المزوّدون بعد الآن إلى تقسيم مسارات التعرف حسب اللهجات الإقليمية، مما يسهل عملية النشر. (المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت