جروك تطلق استنساخ الصوت: سجل دقيقة واحدة لإنشاء صوت ذكاء اصطناعي خاص بك

وفقًا للمراقبة بواسطة Beating، أطلقت xAI أصوات Grok المخصصة ومكتبة الصوت. يمكن للمستخدمين تسجيل جزء من صوتهم في وحدة تحكم xAI لإنشاء معرف صوت خاص بهم، والذي يمكن بعد ذلك دمجه مع واجهة برمجة تطبيقات Grok TTS أو Voice Agent للتطبيقات مثل وكلاء خدمة العملاء، إنشاء المحتوى، شخصيات الألعاب، والتعليق الصوتي للكتب المسموعة. هذه الوظيفة ليست مجرد رفع صوت للتقليد. يجب على المستخدمين قراءة والتحقق من عبارات قصيرة، حيث يقوم النظام بإجراء نسخ صوتي في الوقت الحقيقي باستخدام STT ومقارنة خصائص المتحدث في التسجيل التحققي مع التسجيل الكامل لتأكيد أنهم نفس الشخص قبل إنشاء الصوت. وتذكر xAI أن هذا يمنع تقليد أصوات الآخرين باستخدام تسجيلات موجودة مسبقًا. حاليًا، الأصوات المخصصة متاحة فقط في الولايات المتحدة، باستثناء إلينوي. تتيح وحدة التحكم إنشاء ما يصل إلى 30 صوتًا مخصصًا مجانًا، بينما تقتصر قدرات إنشاء API على فرق المؤسسات. لا توجد رسوم إضافية على الأصوات المخصصة نفسها، لكن استخدام واجهة برمجة تطبيقات الصوت يُحتسب حسب الاستخدام: في الوقت الحقيقي بمبلغ 3.00 دولارات في الساعة، وText to Speech بمبلغ 4.20 دولارات لكل مليون حرف.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت