币界網消息,Inworld AI發布了即時對話語音合成模型TTS-2,該模型能夠根據對話的語氣變化進行聲音調整。其前代TTS-1.5在第三方評測平台上排名第一,領先谷歌和ElevenLabs。TTS-2新增四項核心能力,包括對話感知、自然語言語音指導、跨語言一致性和文字造聲。該模型支持15種正式語言和90多種實驗性語言,已上線Cloudflare、LiveKit、DeepInfra等平台。CEO Kylan Gibbs在《Business Insider》專訪中表示,Inworld只做模型和API,不做消費端產品,避免與客戶競爭。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆