OpenAI відкрив код realtime-voice-component — це бібліотека компонентів React, яка дозволяє вбудовувати голосове керування у веб-застосунки. Після того, як користувач говорить, модель через попередньо визначені інструменти безпосередньо викликає функції застосунку, не створюючи текстових журналів. На основі API realtime у поєднанні з gpt-realtime-1.5, ліцензія Apache-2.0. Надані інтерфейси definevoicetool(), createvoicecontrolcontroller(), voicecontrolwidget, ghostcursoroverlay тощо для ознайомлення та навчання, не опубліковані на npm.

CoinNetwork

2026-05-06 09:41:54

Генерація анотацій у процесі

Звіт з Coinjie, OpenAI відкрила вихідний код компонента реального часу голосу, це набір компонентів React, що дозволяє розробникам вбудовувати можливості голосового управління у веб-застосунки. Користувачі говорять через мікрофон, модель використовує попередньо визначені інструменти для безпосереднього виклику функцій застосунку, а не для генерації текстових відповідей. Ця бібліотека базується на API реального часу OpenAI у поєднанні з gpt-realtime-1.5, ліцензована за Apache-2.0. Розробники використовують definevoicetool() для реєстрації дій застосунку як голосового інструменту, createvoicecontrolcontroller() для управління сесіями та з’єднаннями, voicecontrolwidget забезпечує кнопку запуску, ghostcursoroverlay показує місце дії AI, щоб надати користувачам візуальне підтвердження. Ця бібліотека позиціонується як зразкова реалізація та навчальний інструмент, не була опублікована на npm, у readme зазначено «не обіцяє виробничий рівень UI-фреймворку».

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
GateSquareMayTradingShare
898.07K Популярність
#
BTCBackAbove80K
59.42M Популярність
#
IsraelStrikesIranBTCPlunges
45.08K Популярність
#
JapanTokenizesGovernmentBonds
1.88M Популярність
#
#DailyPolymarketHotspot
865.17K Популярність

Закріпити

карта сайту

OpenAI відкритий код React-інтерфейсу голосового управління: за допомогою gpt-realtime-1.5 дозволяє користувачам керувати додатком голосом

Популярні теми

GateSquareMayTradingShare

BTCBackAbove80K

IsraelStrikesIranBTCPlunges

JapanTokenizesGovernmentBonds

#DailyPolymarketHotspot

Закріпити