Noticias de CoinWorld, Inworld AI ha lanzado el modelo de síntesis de voz en tiempo real para diálogos TTS-2, que puede ajustar la voz según el tono del diálogo. Su predecesor TTS-1.5 ocupó el primer lugar en plataformas de evaluación de terceros, superando a Google y ElevenLabs. TTS-2 añade cuatro capacidades principales, incluyendo percepción de diálogo, guía de voz en lenguaje natural, coherencia entre idiomas y creación de voz a partir de texto. El modelo soporta 15 idiomas oficiales y más de 90 idiomas experimentales, y ya está disponible en plataformas como Cloudflare, LiveKit y DeepInfra. El CEO Kylan Gibbs afirmó en una entrevista con Business Insider que Inworld solo desarrolla modelos y API, y no productos para consumidores, para evitar competir con sus clientes.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado