سيصبح وضع الصوت في ChatGPT أكثر سلاسة من خلال النموذج الجديد في الوقت الحقيقي

robot
إنشاء الملخص قيد التقدم

موقع Investing.com – وفقًا لتقرير من The Information، تقوم شركة OpenAI بتطوير نموذج صوتي جديد يهدف إلى جعل الحوار مع ChatGPT أقل آلية، حيث يسمح النموذج للذكاء الاصطناعي بضبط ردوده بشكل فوري عند مقاطعته.

حاليًا، يستخدم وضع الصوت المتقدم في ChatGPT نظام حوار دوري، يتطلب من المستخدم إكمال كلامه قبل أن يعالج الذكاء الاصطناعي الصوت ويولد ردًا. إذا قاطع المستخدم بكلمات مثل “حسنًا” أو “嗯嗯”، يتوقف النموذج تمامًا عن الكلام، بدلاً من الاستمرار بشكل طبيعي في الحوار.

يهدف النموذج الجديد المسمى ثنائي الاتجاه أو BiDi إلى معالجة صوت المتحدث بشكل مستمر، بحيث يمكنه تعديل ردوده على الفور عند المقاطعة. مقارنةً بالنماذج الصوتية الحالية، فإن هذا سيجعل سير الحوار أكثر طبيعية، لأن النماذج الحالية بمجرد أن يبدأ الذكاء الاصطناعي في الكلام، فإن الردود تكون ثابتة ولا يمكن تعديلها.

ومع ذلك، فإن التقنية لم تكن جاهزة بعد للإطلاق. وفقًا لمصدر مطلع على المشروع، بعد بضع دقائق من الحوار، غالبًا ما تبدأ النماذج الأولية في التعطل أو إصدار أصوات غريبة. على الرغم من أن باحثي OpenAI كانوا يأملون في إصدار BiDi في الربع الأول من هذا العام، إلا أن الجدول الزمني قد يتأخر إلى الربع الثاني أو بعده.

تعتقد OpenAI أن تقليل الفجوة في الأداء بين النماذج الصوتية والنماذج النصية سيزيد من استخدام الذكاء الاصطناعي على مستوى العالم، لأن معظم الناس سيجدون أن التحدث مع مساعد ذكي أكثر طبيعية من إرسال النصوص.

من المتوقع أن يكون نموذج BiDi مفيدًا بشكل خاص في تطبيقات دعم العملاء. على سبيل المثال، إذا قرر عميل يتصل بوكيل دعم عبر الذكاء الاصطناعي في متجر تجزئة استبدال منتج بدلاً من إرجاعه، فمن الناحية النظرية، سيسمح نموذج BiDi للوكيل بتحويل الحوار بسلاسة، بدلاً من التوقف أو الشعور بالحيرة.

قال شخص مطلع على النموذج الصوتي إنه يتفوق أيضًا في استخدام الأدوات والتطبيقات الخارجية. كانت شركة OpenAI قد أعلنت سابقًا عن خطط لتحسين نماذجها الصوتية لاستخدامها في أجهزة تعتمد على الذكاء الاصطناعي مستقبلاً، حيث سيكون المستخدمون قادرين على التفاعل صوتيًا بشكل رئيسي، ويدرسون تطوير مكبر صوت ذكي يمكنه عبر الأوامر الصوتية الاطلاع على البريد الإلكتروني أو حجز الخدمات.

تمت الترجمة بمساعدة الذكاء الاصطناعي. للمزيد من المعلومات، يرجى مراجعة شروط الاستخدام الخاصة بنا.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت