نفس مجموعة التكنولوجيا تُقدم لـ Grok Voice و تيسلا و Starlink، ماسك يلعب لعبة كبيرة جدًا — لقد أتمت دائرة بيئة الصوت بشكل كامل.

شاهد النسخة الأصلية
MeNews
xAI تقدم واجهات برمجة تطبيقات لتحويل الصوت إلى نص والنص إلى صوت باسم Grok
أفادت تقارير أخبار ME أن xAI أطلقت رسميًا واجهتي برمجة صوتية مستقلتين هما Grok STT و Grok TTS. يتميز Grok STT بدقة عالية، وتأخير منخفض، ويدعم المعالجة الجماعية عبر REST، والتحويل الفوري عبر WebSocket، مع علامات زمنية على مستوى الكلمات، وفصل المتحدثين، ومتعدد القنوات، والتطبيع الذكي للنص العكسي، ويغطي أكثر من 25 لغة؛ السعر للجملة 0.10 دولار أمريكي للساعة، والبث المباشر 0.20 دولار للساعة، مع معدل خطأ في الكلمات أدنى من العديد من المنافسين. يوفر Grok TTS صوتًا سريعًا وطبيعيًا وقابلًا للتحكم الدقيق عبر العلامات، بسعر 4.20 دولارات لكل مليون حرف. كلاهما مبني على نفس تقنية الأساس، ويستخدم من قبل Grok Voice، وتيسلا، وStarlink.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت