Grok 推出语音克隆:录制一分钟,打造属于你的 AI 语音

robot
摘要生成中

根据Beating的监测,xAI已推出Grok自定义语音和语音库。用户可以在xAI控制台中录制一段自己的声音,以生成自己的voice_id,然后可以将其集成到Grok TTS或Voice Agent API中,用于客户服务代理、内容创作、游戏角色和有声书配音等应用。这一功能不仅仅是上传音频进行克隆。用户必须朗读并验证短语,系统会使用STT进行实时转录,并将验证录音的说话人特征与完整录音进行比对,以确认是否为同一人,然后再生成语音。xAI表示,这可以防止使用预先存在的录音克隆他人声音。目前,Custom Voices仅在美国提供,不包括伊利诺伊州。控制台允许免费创建最多30个自定义语音,而API创建功能仅对企业团队开放。自定义语音本身不收取额外费用,但语音API的使用按用量计费:实时语音每小时3.00美元,文本转语音每百万字符4.20美元。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论