Este modelo de voz consegue captar até microexpressões, com milhões de combinações de personalidades, no futuro os apresentadores virtuais vão ser difíceis de distinguir do real ou do falso.

Ver original
MeNews
StepAudio 2.5 publicação de voz em tempo real: percepção de linguagem secundária e interação personalizada
StepAudio 2.5 Realtime é um modelo de voz em tempo real que consegue reconhecer características de linguagem secundária, como tom, velocidade, pausas e microexpressões. Através da API, é possível integrar personalidades personalizadas, definir traços de personalidade, histórias de fundo e estilos de linguagem, com mais de dez mil opções de personalidades nativas, podendo combinar até milhões de características. Possui 5 personalidades predefinidas, ajustadas com RLHF, que mantêm a consistência mesmo em cenários complexos de interpretação de papéis, suportando chinês e inglês.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado