币界网消息,Inworld AI发布了实时对话语音合成模型TTS-2,该模型能够根据对话的语气变化进行声音调整。其前代TTS-1.5在第三方评测平台上排名第一,领先谷歌和ElevenLabs。TTS-2新增四项核心能力,包括对话感知、自然语言语音指导、跨语言一致性和文字造声。该模型支持15种正式语言和90多种实验性语言,已上线Cloudflare、LiveKit、DeepInfra等平台。CEO Kylan Gibbs在《Business Insider》专访中表示,Inworld只做模型和API,不做消费端产品,避免与客户竞争。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论