تسعير واجهة برمجة التطبيقات الصوتية لـ xAI مثير للاهتمام، حيث أن تكلفة التعرف على الكلام بكميات كبيرة فقط 0.1 دولار/ساعة، بينما تكلفة تحويل النص إلى كلام (TTS) أغلى بكثير عند 4.2 دولار/مليون حرف، هل هذا هو سعر القيمة العاطفية؟

شاهد النسخة الأصلية
MeNews
xAI تفتح واجهة برمجة تطبيقات صوتية لـ Grok STT و TTS، مع تقليل معدل الخطأ الكلي في التعرف على الكلام إلى 6.9%
أخبار ME تفيد بأن xAI أطلقت واجهتين برمجيتين مستقلتين للصوت: Grok STT و Grok TTS، المستندتين إلى نفس منصة الصوت، وتدعم Grok Voice، ونظام Tesla المدمج، وخدمة عملاء Starlink وغيرها. يوفر STT تحويل دفعات عبر REST وتدفق مباشر عبر WebSocket، مع علامات زمنية على مستوى الكلمات، وفصل المتحدثين، ومتعدد القنوات، وتحويل النص العكسي، ويغطي أكثر من 25 لغة؛ يدعم TTS العلامات الداخلية للمشاعر والإيقاع. كما أعلن عن مقارنة معدل الخطأ (WER)، حيث يتفوق Grok في سيناريوهات متعددة، ولم يتم إعادة الاختبار من قبل طرف ثالث بعد. السعر: المعالجة الدفعية لـ STT 0.10 دولار أمريكي للساعة، والبث المباشر 0.20 دولار أمريكي للساعة، وTTS بسعر 4.20 دولار لكل مليون حرف.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت