据 1M AI News 的监测,微软已发布一款名为 Vibing 的桌面语音输入工具,基于其自有的开源语音 AI 模型 VibeVoice。该工具支持 macOS 和 Windows,且可免费使用。通过按下快捷键(Mac 右 Option / Windows Ctrl+Win),用户可在任意应用中激活录音,结束后会自动输出文本。AI/ML 社区审阅者 @realmrfakename 测试后表示,转写准确且速度快,并将其描述为“ WisprFlow 的免费替代方案”。Vibing 不仅是语音转文字工具;它会借助 LLM,将口语改写为适合当前语境的书面文本,使用户在输入过程中能够以自然语言直接修改、删除和整理现有内容。其他功能还包括支持连续录音超过 5 分钟、自动识别 50+ 种语言、同一句中中英混合输入、可自定义热词,以及实时翻译。底层的微软 VibeVoice 是一组语音 AI 模型,已在 MIT 许可下开源,并且在 GitHub 上拥有超过 28,000 个星标。其中包括一个 7B 参数的 ASR 模型(一次处理 60 分钟音频),一个 1.5B TTS 模型(生成 90 分钟的多人与人语音),以及一个 0.5B 实时模型(300ms 延迟)。WisprFlow 目前是 Mac 上最受欢迎的 AI 语音输入工具之一,可通过每月订阅使用;而 Vibing 则进入同一市场,作为一个免费且开源的选项。
微软推出免费语音输入工具Vibing,与付费产品WisprFlow竞争
据 1M AI News 的监测,微软已发布一款名为 Vibing 的桌面语音输入工具,基于其自有的开源语音 AI 模型 VibeVoice。该工具支持 macOS 和 Windows,且可免费使用。通过按下快捷键(Mac 右 Option / Windows Ctrl+Win),用户可在任意应用中激活录音,结束后会自动输出文本。AI/ML 社区审阅者 @realmrfakename 测试后表示,转写准确且速度快,并将其描述为“ WisprFlow 的免费替代方案”。Vibing 不仅是语音转文字工具;它会借助 LLM,将口语改写为适合当前语境的书面文本,使用户在输入过程中能够以自然语言直接修改、删除和整理现有内容。其他功能还包括支持连续录音超过 5 分钟、自动识别 50+ 种语言、同一句中中英混合输入、可自定义热词,以及实时翻译。底层的微软 VibeVoice 是一组语音 AI 模型,已在 MIT 许可下开源,并且在 GitHub 上拥有超过 28,000 个星标。其中包括一个 7B 参数的 ASR 模型(一次处理 60 分钟音频),一个 1.5B TTS 模型(生成 90 分钟的多人与人语音),以及一个 0.5B 实时模型(300ms 延迟)。WisprFlow 目前是 Mac 上最受欢迎的 AI 语音输入工具之一,可通过每月订阅使用;而 Vibing 则进入同一市场,作为一个免费且开源的选项。