Ce modèle vocal peut même capturer les micro-expressions, avec des millions de combinaisons de personnalités, à l'avenir, les streamers virtuels risquent de devenir indiscernables du vrai.

Voir l'original
MeNews
StepAudio 2.5 publication vocale en temps réel : perception de la sous-langue et interaction personnalisée
StepAudio 2.5 Realtime est un modèle de voix en temps réel capable de reconnaître des caractéristiques paralangagiques telles que l'intonation, la vitesse, les pauses et les micro-expressions. Via une API, il peut intégrer une personnalité personnalisée, en définissant le caractère, l'histoire de fond et le style linguistique, avec plus de dix mille options de personnalités natives, permettant des combinaisons pouvant atteindre plusieurs millions de caractéristiques. Il dispose de 5 personnalités préconfigurées, ajustées par RLHF, pouvant maintenir la cohérence même dans des scénarios de jeu de rôle complexes, et supporte le chinois et l'anglais.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé