OpenAI código aberto do componente de voz React: usando gpt-realtime-1.5 para permitir que os usuários controlem o App falando

robot
Geração de resumo em curso

Notícias do site Coinjie, a OpenAI lançou de código aberto o realtime-voice-component, uma biblioteca de componentes React que permite aos desenvolvedores incorporar capacidades de controle por voz em aplicações Web. Os utilizadores falam através do microfone, e o modelo utiliza ferramentas predefinidas para chamar diretamente funcionalidades da aplicação, em vez de gerar respostas em texto. Esta biblioteca é baseada na API realtime da OpenAI, combinada com gpt-realtime-1.5, e utiliza a licença Apache-2.0. Os desenvolvedores registam ações de aplicação como ferramentas de voz usando definevoicetool(), gerenciam sessões e ligações com createvoicecontrolcontroller(), a voicecontrolwidget fornece um botão de início, ghostcursoroverlay mostra a posição de operação da IA, oferecendo confirmação visual ao utilizador. A biblioteca é posicionada como uma implementação de referência e para fins educativos, não tendo sido publicada no npm, e o readme indica que «não é uma promessa de um framework UI de nível de produção».

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar