OpenAI مفتوح المصدر مكون React للتحكم الصوتي: استخدم gpt-realtime-1.5 لتمكين المستخدم من التحكم في التطبيق باستخدام الصوت

robot
إنشاء الملخص قيد التقدم

موقع Coinjie News، أطلقت OpenAI مكتبة مكونات الصوت في الوقت الحقيقي مفتوحة المصدر، وهي مجموعة مكونات React تتيح للمطورين دمج قدرات التحكم الصوتي في تطبيقات الويب. من خلال الميكروفون، يتحدث المستخدم، ويستخدم النموذج أدوات محددة مسبقًا لاستدعاء وظائف التطبيق مباشرة، بدلاً من توليد ردود نصية. تعتمد هذه المكتبة على واجهة برمجة التطبيقات realtime من OpenAI، وتستخدم مع gpt-realtime-1.5، وترخيصها Apache-2.0. يستخدم المطورون definevoicetool() لتسجيل وظائف التطبيق كأدوات صوتية، و createvoicecontrolcontroller() لإدارة الجلسات والاتصالات، و voicecontrolwidget يوفر زر بدء التشغيل، و ghostcursoroverlay يعرض موقع عمليات الذكاء الاصطناعي، ليمنح المستخدم تأكيدًا بصريًا. تعتبر هذه المكتبة تنفيذًا مرجعيًا وغرضًا تعليميًا، ولم تُنشر على npm، ويذكر في ملف readme أنها «ليست وعدًا بإطار واجهة مستخدم من مستوى الإنتاج».

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت