خبر شبكة币界، أطلقت Inworld AI نموذج توليف الصوت الحواري في الوقت الحقيقي TTS-2، الذي يمكنه تعديل الصوت وفقًا لتغير نبرة الحوار. كان النموذج السابق TTS-1.5 يحتل المرتبة الأولى على منصة التقييمات الخارجية، متفوقًا على جوجل وElevenLabs. أضاف TTS-2 أربع قدرات أساسية جديدة، بما في ذلك الإدراك الحواري، وتوجيه الصوت باللغة الطبيعية، والاتساق عبر اللغات، وتوليد الصوت من النص. يدعم النموذج 15 لغة رسمية وأكثر من 90 لغة تجريبية، وتم إطلاقه على منصات مثل Cloudflare وLiveKit وDeepInfra. قال الرئيس التنفيذي كيلان جيبس في مقابلة مع "بيزنس إنسايدر" إن Inworld تركز فقط على النماذج وواجهات برمجة التطبيقات، ولا تنتج منتجات للمستهلكين، لتجنب المنافسة مع العملاء.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت