Este modelo de voz incluso puede captar microexpresiones, millones de combinaciones de personalidades, en el futuro los presentadores virtuales serán difíciles de distinguir entre lo real y lo falso.

Ver original
MeNews
StepAudio 2.5 publicación de voz en tiempo real: percepción de sublenguaje e interacción personalizada
StepAudio 2.5 Realtime es un modelo de voz en tiempo real que puede reconocer características paralingüísticas como tono, velocidad, pausas y microexpresiones. A través de la API, se puede integrar una personalidad personalizada, establecer rasgos de carácter, historia de fondo y estilo de lenguaje, con más de diez mil opciones de personalidades nativas, combinaciones que alcanzan millones de características. Incluye 5 personalidades predefinidas, ajustadas mediante RLHF, que mantienen la coherencia incluso en escenarios complejos de interpretación de roles, y soporta chino e inglés.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado