الرئيس التنفيذي السابق لتقنية المعلومات في OpenAI يتحدى شركته القديمة: النموذج الجديد يرد في 200 مللي ثانية ويتفوق على GPT-ريال تايم

وفقًا لمراقبة دونتشا بيتينج، أطلقت مختبر “التفكير الآلي” الذي أسسته تيرا موراتي، المدير التقني السابق في OpenAI، معاينة بحثية لنموذجها “التفاعلي”. يتخلى النظام الجديد عن النهج التقليدي لدمج الصوت والنص باستخدام أدوات خارجية، وبدلاً من ذلك يتعامل بشكل أصلي مع التفاعلات الصوتية والفيديو في الوقت الحقيقي. يمكن للنموذج استقبال المعلومات بشكل مستمر مع “تدوير ميكرو” مدته 200 مللي ثانية، مما يسمح بالاستماع والمشاهدة والكلام في آن واحد، مع دعم الانقطاعات الفورية من المستخدمين. النموذج المعروض الأول، TML-Interaction-Small، يستخدم بنية MoE تحتوي على 276 مليار معلمة، تنشط 12 مليار معلمة في الوقت ذاته. لمعالجة عيب النموذج الكبير التقليدي المتمثل في “توقف الإدراك عند توليد الردود”، قام فريق التطوير بتقسيم النظام إلى واجهة أمامية وخلفية: النموذج الأمامي مخصص للحفاظ على الحوار المستمر، بينما يتعامل النموذج الخلفي في الوقت ذاته مع التفكير المعقد، والبحث عبر الإنترنت، أو توليد واجهة المستخدم، مع نقل النتائج بسلاسة إلى الواجهة الأمامية. تتفوق هذه الهندسة مباشرة على سرعة استجابة منافسي الشركة القديمة. تظهر البيانات الرسمية أن تأخير تدوير الصوت لا يتجاوز 0.40 ثانية، محققًا درجة 77.8 في اختبار FD-bench V1.5، مع تجاوز كلا المقياسين الأساسيين لمعياري GPT-realtime-2.0 و Gemini 3.1 Flash Live. ومع ذلك، فإن المعالجة المستمرة للصوت والفيديو يمكن أن تستهلك بسرعة سعة السياق، ويعتمد تأثير انخفاض الكمون بشكل كبير على ظروف الشبكة. تخطط شركة Thinking Machines لفتح معاينة محدودة في الأشهر القادمة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت