تم إصدار تقييم الطرف الثالث: النموذج الجديد لشركة ثينكينج ماشينز يتوافق مع GPT-Realtime-2، ويتصدر تصنيفات الصوتيات

وفقًا للمراقبة التي أجرتها Dongcha Beating، أعلنت منصة البيانات Scale Labs عن أحدث تصنيفات Audio MC S2S. أظهرت نتائج التقييم أن النموذج الجديد لـ Thinking Machines، TML-Interaction-Small، حقق درجة APR بلغت 43.4٪، متساويًا مع المركز الأول مع GPT-Realtime-2 (xHigh) من OpenAI. من حيث الدرجات المحددة، يحتل GPT-Realtime-2 (xHigh) المركز الأعلى بشكل مطلق برصيد 48.45 نقطة، يليه مباشرة TML-Interaction-Small برصيد 43.36 نقطة. نظرًا لأن فرق النقاط يقع ضمن هامش الخطأ الإحصائي، يُصنف كلا النموذجين رسميًا على أنهما متساويان في المركز الأول. يلي ذلك المستوى الثاني مع النسخة القياسية من GPT-Realtime-2 (37.61 نقطة)، وGemini 3.1 Flash Live المفعلة بوضع التفكير (36.06 نقطة)، وGPT-Realtime-1.5 الأقدم. لاحظت Scale Labs أن هذا النموذج يُظهر قدرة نادرة على الوعي بالسياق الطويل بين النماذج ذات التفاعل الكامل الحالية، مع الحفاظ على سرعة استجابة عالية في المحادثات.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت