Grok lance la clonage vocal : en enregistrant une minute, vous pouvez créer votre propre voix IA

robot
Création du résumé en cours

Selon la surveillance Beating, xAI a lancé Grok Custom Voices et Voice Library.
Les utilisateurs peuvent enregistrer un extrait sonore sur la console xAI, générer leur propre voice_id, puis l’intégrer à l’API Grok TTS ou Voice Agent, pour des scénarios tels que agents de service client, création de contenu, personnages de jeux, narration de livres audio, etc.

Cette fonctionnalité ne consiste pas simplement à télécharger un audio pour le cloner.
Les utilisateurs doivent lire une phrase de vérification, le système effectuera une transcription en temps réel avec STT, puis comparera les caractéristiques vocales de l’enregistrement de vérification et de l’enregistrement complet, pour confirmer qu’il s’agit de la même personne avant de générer la voix.
xAI affirme que cela peut empêcher le clonage de la voix d’autrui avec des enregistrements existants.

Actuellement, Custom Voices est uniquement disponible aux États-Unis, à l’exception de l’Illinois.
La console permet de créer gratuitement jusqu’à 30 voix personnalisées, la capacité de création via API étant réservée à l’équipe Enterprise.
Les voix personnalisées elles-mêmes ne sont pas facturées en supplément, mais l’utilisation de l’API vocale reste payante à l’usage : Realtime à 3,00 $/heure, Text to Speech à 4,20 $ par million de caractères.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler