xAI هذه المجموعة من الصوتيات تضرب بقوة، تسعير STT التدفقي 0.2 دولار/ساعة مباشرة مقابل Whisper، وTTS مع علامات عاطفية، هل يخطط ماسك لتحويل مسار الصوت إلى بحر دماء؟

XAI4.39%
STT3.84%
شاهد النسخة الأصلية
MeNews
xAI تفتح واجهة برمجة تطبيقات صوتية لـ Grok STT و TTS، مع تقليل معدل الخطأ الكلي في التعرف على الكلام إلى 6.9%
تقرير أخبار ME: أطلقت xAI واجهتين برمجيتين مستقلتين للصوت: Grok STT و Grok TTS، المستندتين إلى نفس منصة الصوت، وتدعم Grok Voice ونظام Tesla المدمج وخدمة عملاء Starlink وغيرها. يوفر STT تحويل دفعات عبر REST وتدفق مباشر عبر WebSocket، مع علامات زمنية على مستوى الكلمات، وفصل المتحدث، وقنوات متعددة، وتطبيع النص العكسي، ويغطي أكثر من 25 لغة؛ يدعم TTS العلامات الداخلية للمشاعر والإيقاع. كما أعلنت عن مقارنة معدل الخطأ (WER)، حيث يتفوق Grok في سيناريوهات متعددة، ولم يتم إعادة الاختبار من قبل طرف ثالث بعد. السعر: المعالجة الدفعية لـ STT 0.10 دولار أمريكي للساعة، والبث المباشر 0.20 دولار أمريكي للساعة، وTTS بسعر 4.20 دولار لكل مليون حرف.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت