Grok lanza clonación de voz: graba un minuto para crear tu propia voz de IA

robot
Generación de resúmenes en curso

Según la monitorización de Beating, xAI ha lanzado Voces Personalizadas de Grok y Biblioteca de Voces. Los usuarios pueden grabar un segmento de su voz en la consola de xAI para generar su propio voice_id, que luego puede integrarse con la API de Grok TTS o Voice Agent para aplicaciones como agentes de atención al cliente, creación de contenido, personajes de juegos y narración de audiolibros. Esta funcionalidad no consiste simplemente en subir audio para clonar. Los usuarios deben leer y verificar frases cortas, con el sistema realizando transcripciones en tiempo real mediante STT y comparando las características del hablante de la grabación de verificación con la grabación completa para confirmar que son la misma persona antes de generar la voz. xAI afirma que esto evita la clonación de voces de otros usando grabaciones preexistentes. Actualmente, las Voces Personalizadas solo están disponibles en Estados Unidos, excluyendo Illinois. La consola permite la creación gratuita de hasta 30 voces personalizadas, mientras que las capacidades de creación mediante API solo están disponibles para equipos empresariales. No hay cargo adicional por las voces personalizadas en sí, pero el uso de la API de voz se factura por uso: en tiempo real a $3.00/hora y Texto a Voz a $4.20 por millón de caracteres.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado