币界网消息,Inworld AI发布了实时对话语音合成模型TTS-2,该模型能够根据对话的语气变化进行声音调整。


其前代TTS-1.5在第三方评测平台上排名第一,领先谷歌和ElevenLabs。
TTS-2新增四项核心能力,包括对话感知、自然语言语音指导、跨语言一致性和文字造声。
该模型支持15种正式语言和90多种实验性语言,已上线Cloudflare、LiveKit、DeepInfra等平台。
CEO Kylan Gibbs在《Business Insider》专访中表示,Inworld只做模型和API,不做消费端产品,避免与客户竞争。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン