Este modelo de voz consegue captar até microexpressões, milhões de combinações de personalidades, no futuro os apresentadores virtuais vão ser difíceis de distinguir do real ou do falso.

Ver original
MeNews
StepAudio 2.5 publicação de voz em tempo real: percepção de linguagem secundária e interação personalizada
StepAudio 2.5 Realtime é um modelo de voz em tempo real, capaz de reconhecer características paralinguísticas como tom, velocidade, pausas e microexpressões. Através de API, é possível integrar personalidades personalizadas, definir traços de personalidade, histórias de fundo e estilos de linguagem, com mais de dez mil opções de personalidades nativas, podendo combinar até milhões de características. Possui 5 personalidades predefinidas integradas, ajustadas com RLHF, que mantêm consistência mesmo em cenários complexos de interpretação de papéis, suportando chinês e inglês.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado