OpenAI відкритий код React-інтерфейсу голосового управління: за допомогою gpt-realtime-1.5 дозволяє користувачам керувати додатком голосом

robot
Генерація анотацій у процесі

Звіт з Coinjie, OpenAI відкрила вихідний код компонента реального часу голосу, це набір компонентів React, що дозволяє розробникам вбудовувати можливості голосового управління у веб-застосунки. Користувачі говорять через мікрофон, модель використовує попередньо визначені інструменти для безпосереднього виклику функцій застосунку, а не для генерації текстових відповідей. Ця бібліотека базується на API реального часу OpenAI у поєднанні з gpt-realtime-1.5, ліцензована за Apache-2.0. Розробники використовують definevoicetool() для реєстрації дій застосунку як голосового інструменту, createvoicecontrolcontroller() для управління сесіями та з’єднаннями, voicecontrolwidget забезпечує кнопку запуску, ghostcursoroverlay показує місце дії AI, щоб надати користувачам візуальне підтвердження. Ця бібліотека позиціонується як зразкова реалізація та навчальний інструмент, не була опублікована на npm, у readme зазначено «не обіцяє виробничий рівень UI-фреймворку».

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити