أخبار ME، في 20 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 动察 Beating، أصدرت مختبرات 通义 في 20 أبريل نموذج التعرف على الصوت Fun-ASR1.5، وتم إطلاقه على واجهة برمجة التطبيقات API على منصة 阿里云百炼، وفتح تجربة مباشرة في مجتمع 魔搭. وذكروا رسميًا أن هذه النسخة تغطي نموذجًا واحدًا 30 لغة، وسبع لهجات رئيسية للغة الصينية و أكثر من 20 لهجة إقليمية، ولم تعد تعتمد على نماذج منفصلة حسب اللهجة. أظهرت التقييمات الداخلية التي قدمتها 通义 أن معدل الأخطاء في الكلمات في سيناريوهات اللهجات النموذجية انخفض بنسبة 56.2% مقارنة بالنسخة السابقة، وأن دقة خمس لهجات تجاوزت 90%، و15 لهجة تجاوزت 80%. كما تم تخصيص تحسينات خاصة للتعرف على الأشعار القديمة، وذكرت المصادر أن الدقة على مستوى الأحرف الداخلية بلغت 97%. كل هذه الأرقام تأتي من الاختبارات الذاتية لـ 通义، وليست من معايير طرف ثالث. بدأت اللهجات ذات التردد الطويل والأصعب في التعرف في مجال التعرف على الصوت باللغة الصينية تُدمج ضمن مجموعة القدرات التي يمكن استخدامها مباشرة في التطبيقات التجارية. بالنسبة لسيناريوهات مثل البث التعليمي، وخطوط خدمة الحكومة المحلية، وتنظيم المقابلات، لن يحتاج المزوّدون بعد الآن إلى تقسيم مسارات التعرف حسب اللهجات الإقليمية، مما يسهل عملية النشر. (المصدر: BlockBeats)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
GateIPOAccessSpaceX
6.6M درجة الشعبية
#
StrategyAdds1550BTCatLowerPrices
2.88M درجة الشعبية
#
IsraelStrikesIranBTCPlunges
56.77K درجة الشعبية
#
StrongNonfarmPayrollsRekindleRateHikeFear
1.82M درجة الشعبية
#
PredictNBAChampionWin20000U
854.1K درجة الشعبية

مُثبت

خريطة الموقع

تطلق Tongyi Fun-ASR1.5، مع التركيز على التعرف على اللهجات

المواضيع الرائجة

GateIPOAccessSpaceX

StrategyAdds1550BTCatLowerPrices

IsraelStrikesIranBTCPlunges

StrongNonfarmPayrollsRekindleRateHikeFear

PredictNBAChampionWin20000U

مُثبت