STT 词错率比竞品低、TTS 还能用标签细调语气,同一套技术栈喂给 Grok Voice、特斯拉和星链——马斯克这是要把语音交互的上下游全吃透啊

ME News
xAI 推出 Grok 语音转文本与文本转语音 API
ME News 报道,xAI 正式推出 Grok STT 与 Grok TTS 两款独立音频 API。Grok STT 具高准确率、低延迟,支持 REST 批量处理、WebSocket 实时转录,具词级时间戳、说话人分离、多声道及智能逆文本规范化,覆盖超过 25 种语言;批量0.10 美元/小时、流式0.20 美元/小时,词错率优于多家对手。Grok TTS 提供快速、自然、可通过标签实现细粒控的语音,定价每百万字符4.20 美元。两者基于同一技术栈,供 Grok Voice、特斯拉与 Starlink 使用。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论