Grok lanza Voice Clone: graba un minuto y podrás crear tu propia voz AI

robot
Generación de resúmenes en curso

Según la monitorización de Beating, xAI lanzó Grok Custom Voices y Voice Library. Los usuarios pueden grabar una muestra de voz en la consola de xAI, generar su propio voice_id, y luego integrarlo con la API de Grok TTS o Voice Agent, para escenarios como agentes de atención al cliente, creación de contenido, personajes de juegos, narración de audiolibros, etc.

Esta función no consiste simplemente en subir un audio para clonar la voz. Los usuarios deben leer en voz alta una frase de verificación, el sistema realizará una transcripción en tiempo real con STT, y comparará las características del hablante entre la grabación de verificación y la grabación completa, confirmando que son la misma persona antes de generar la línea de voz. xAI afirma que esto puede prevenir el uso de grabaciones existentes para clonar la voz de otros.

Actualmente, Custom Voices solo está disponible en Estados Unidos, excluyendo Illinois. La consola permite crear hasta 30 voces personalizadas de forma gratuita, y la capacidad de creación mediante API solo está disponible para equipos Enterprise. Las voces personalizadas en sí no tienen costo adicional, pero el uso de la API de voz sigue facturándose por volumen: Realtime a $3.00/hora, Text to Speech a $4.20 por millón de caracteres.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado