هذه النموذج الصوتي يمكنه التقاط حتى التعبيرات الدقيقة، وملايين تركيبات الشخصيات، في المستقبل قد يصبح من الصعب التمييز بين الحقيقي والمزيف في المذيعين الافتراضيين

شاهد النسخة الأصلية
MeNews
StepAudio 2.5 إصدار الصوت المباشر: الإدراك اللغوي الفرعي والتفاعل الشخصي
StepAudio 2.5 Realtime هو نموذج صوتي فوري يمكنه التعرف على خصائص اللغة الثانوية مثل النغمة، سرعة الكلام، التوقفات، والتعبيرات الدقيقة. من خلال واجهة برمجة التطبيقات يمكن ربط شخصية مخصصة، وتحديد الشخصية، القصة الخلفية، والأسلوب اللغوي، مع وجود الآلاف من الخيارات الأصلية للشخصيات، وتشكيلات تصل إلى ملايين من الميزات. مدمج معه 5 شخصيات افتراضية معدلة بواسطة RLHF، ويمكنه الحفاظ على الاتساق في سيناريوهات لعب الأدوار المعقدة، ويدعم اللغة الصينية والإنجليزية.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت