OpenAI código abierto del control de voz en React: usa gpt-realtime-1.5 para que los usuarios puedan controlar la aplicación hablando

robot
Generación de resúmenes en curso

La noticia de CoinWorld, OpenAI ha lanzado de código abierto realtime-voice-component, que es una biblioteca de componentes React que permite a los desarrolladores integrar capacidades de control por voz en aplicaciones web. Los usuarios hablan a través del micrófono, y el modelo utiliza herramientas predefinidas para llamar directamente a funciones de la aplicación, en lugar de generar respuestas en texto. La biblioteca se basa en la API en tiempo real de OpenAI, junto con gpt-realtime-1.5, y está licenciada bajo Apache-2.0. Los desarrolladores registran acciones de la aplicación como herramientas de voz usando definevoicetool(), gestionan sesiones y conexiones con createvoicecontrolcontroller(), y voicecontrolwidget proporciona un botón de inicio, ghostcursoroverlay muestra la posición de la operación de IA, para que los usuarios tengan una confirmación visual. La biblioteca se posiciona como una implementación de referencia y para fines educativos, no se ha publicado en npm, y el README indica que “no es una promesa de un marco de interfaz de usuario de nivel productivo”.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado