تقرير أخبار ME، أطلقت xAI واجهتي برمجة تطبيقات صوتية مستقلة: Grok STT و Grok TTS، المستندة إلى نفس منصة الصوت، وتدعم Grok Voice، ونظام Tesla المدمج، وخدمة عملاء Starlink وغيرها. يوفر STT تحويل دفعات عبر REST وتدفق مباشر عبر WebSocket، مع علامات زمنية على مستوى الكلمات، وفصل المتحدثين، ومتعدد القنوات، ومعايرة النص العكسي، ويغطي أكثر من 25 لغة؛ يدعم TTS العلامات الداخلية للمشاعر والإيقاع. كما أعلن عن مقارنة معدل الخطأ (WER)، حيث يتفوق Grok في سيناريوهات متعددة، ولم يتم إعادة الاختبار من قبل طرف ثالث بعد. السعر: المعالجة الدفعية لـ STT 0.10 دولار أمريكي للساعة، والبث المباشر 0.20 دولار أمريكي للساعة، وTTS 4.20 دولار لكل مليون حرف.

MeNews

2026-05-27 02:47:48

إنشاء الملخص قيد التقدم

موجز أخبار ME، 18 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 动察 Beating، أطلقت xAI واجهتي برمجة تطبيقات صوتية مستقلة: Grok Speech to Text و Grok Text to Speech. كلاهما يأتي من نفس بنية الصوت التي تدعم Grok Voice، ونظام تيسلا المدمج في السيارات، وخدمة Starlink، وتم فتحهما الآن كواجهات مستقلة، بحيث يمكن للمطورين الوصول مباشرة إلى وكلاء الصوت، والتحويل الفوري للنص، وأدوات الوصول، والبودكاست، وغيرها من التطبيقات. يوفر STT وضعين. واجهة برمجة التطبيقات REST مخصصة لتحويل ملفات صوتية كبيرة دفعة واحدة، مع استجابة خلال ميلي ثانية؛ وواجهة WebSocket موجهة للبث الصوتي في الوقت الحقيقي. تشمل القدرات المرفقة علامات زمنية على مستوى الكلمات، وفصل المتحدثين (diarization)، والتعرف على قنوات متعددة بشكل منفصل، بالإضافة إلى التحويل العكسي للنص، وهو تحويل الأرقام والتواريخ والعملات الموجودة في الكلام إلى نص منسق ومعتمد. تدعم أكثر من 25 لغة، ويمكن التبديل بينها بسلاسة أثناء الحوار. كما أعلنت xAI عن مجموعة من مقاييس معدل الخطأ في التعرف على الكلمات (WER، حيث يكون الرقم أقل أفضل): في السيناريوهات العامة، كانت نسب Grok 6.9%، وElevenLabs 9.0%، وDeepgram 11.0%، وAssemblyAI 12.9%; أما في التعرف على الكيانات في المكالمات الهاتفية، فكانت الفجوة أكبر، حيث كانت نسب Grok 5.0%، مقابل 12.0%، و13.5%، و21.3% للشركات الثلاث على التوالي. في سيناريوهات الاجتماعات والبودكاست والفواتير الهاتفية، كانت Grok تتفوق بشكل طفيف. تم نشر هذه الأرقام من قبل xAI بعد اختبار داخلي، ولم يتم التحقق منها من قبل طرف ثالث بعد. من ناحية التسعير، فإن معالجة دفعات STT تكلف 0.10 دولار أمريكي للساعة، والبث المباشر 0.20 دولار للساعة؛ وTTS تكلف 4.20 دولار لكل مليون حرف. يدعم TTS التحكم في العاطفة والإيقاع باستخدام علامات Speech Tags المدمجة، مثل \[laugh\]\، \[sigh\]\، \[whisper\]\، وغيرها. (المصدر: BlockBeats)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 10

أعجبني
10
6
إعادة النشر
مشاركة

تعليق

إضافة تعليق

GovernanceVotingTug-Of-WarKing

· منذ 6 س

25+ تغطية اللغات جيدة، لكن جودة اللغات الصغيرة مشكوك فيها، لمعرفتها إلا بعد التجربة

شاهد النسخة الأصليةرد0

ViewingBullAndBearMarketsFromA

· منذ 6 س

كم تتأخر تدفقات WebSocket في الوقت الحقيقي بالمللي ثانية لم يُذكر، وهو أمر حاسم في سيناريوهات البث المباشر

شاهد النسخة الأصليةرد0

BorrowedHalo

· منذ 6 س

علامات المشاعر المدمجة، هل يمكن للبودكاست الذكي أن يقرأ السخرية في المستقبل؟

شاهد النسخة الأصليةرد0

PuddingMarketMaker

· منذ 6 س

خدمة عملاء ستارلينك أصبحت مستخدمة، دائرة إيكولوجية ماسك مثبتة

شاهد النسخة الأصليةرد0

GateUser-83c80dd0

· منذ 7 س

طابع زمني على مستوى الكلمات + فصل المتحدثين، محررو البودكاست في غاية السعادة

شاهد النسخة الأصليةرد0

TideEarningsTable

· منذ 7 س

4.2 مليون حرف بالدولار الأمريكي، هل هو أرخص أم أغلى من ElevenLabs؟ هل أحد حسبها؟

شاهد النسخة الأصليةرد0

المواضيع الرائجة
عرض المزيد
#
StockTradingChallengeUpTo17000U
16.23M درجة الشعبية
#
TrumpBacksCFTCAuthorityOverPredictionMarkets
820.08K درجة الشعبية
#
IsraelStrikesIranBTCPlunges
49.57K درجة الشعبية
#
GatePredictionMarketAddsSmartMoneyTracking
13.21M درجة الشعبية
#
MicronMarketCapBreaks1Trillion
38.29K درجة الشعبية

مُثبت

خريطة الموقع

xAI تفتح واجهة برمجة تطبيقات صوتية لـ Grok STT و TTS، مع تقليل معدل الخطأ الكلي في التعرف على الكلام إلى 6.9%

المواضيع الرائجة

StockTradingChallengeUpTo17000U

TrumpBacksCFTCAuthorityOverPredictionMarkets

IsraelStrikesIranBTCPlunges

GatePredictionMarketAddsSmartMoneyTracking

MicronMarketCapBreaks1Trillion

مُثبت