据 1M AI News 监测,微软发布桌面语音输入工具 Vibing,基于自家开源语音 AI 模型 VibeVoice,支持 macOS 和 Windows,免费使用。 按下快捷键(Mac 右 Option / Windows Ctrl+Win)即可在任意应用中唤起录音,结束后自动输出文本。 AI/ML 社区测评者 @realmrfakename 亲测后称转录准确、速度快,评价为「WisprFlow 的免费替代品」。 Vibing 不只是语音转文字。 它通过 LLM 将口语重写为适合当前场景的书面文本,支持在输入过程中用自然语言直接修改、删除、整理已有内容。 其他功能包括单次 5 分钟以上连续录音、50+ 语言自动识别、同一句话内中英文混合输入、自定义热词以及实时翻译。 底层的微软 VibeVoice 是 MIT 协议开源的语音 AI 模型家族,GitHub 星标超 2.8 万, 包含 7B 参数的 ASR 模型(单次处理 60 分钟音频)、1.5B 的 TTS 模型(生成 90 分钟多人语音)和 0.5B 的实时模型(300ms 延迟)。 WisprFlow 是目前 Mac 上最受欢迎的 AI 语音输入工具之一,按月订阅收费, Vibing 直接以免费 + 开源的方式进入同一赛道。
マイクロソフトは、自社のVibeVoiceモデルを基にした無料の音声入力ツールVibingをリリースしました。これは、有料製品のWisprFlowと対比・対抗するものです。
据 1M AI News 监测,微软发布桌面语音输入工具 Vibing,基于自家开源语音 AI 模型 VibeVoice,支持 macOS 和 Windows,免费使用。
按下快捷键(Mac 右 Option / Windows Ctrl+Win)即可在任意应用中唤起录音,结束后自动输出文本。
AI/ML 社区测评者 @realmrfakename 亲测后称转录准确、速度快,评价为「WisprFlow 的免费替代品」。
Vibing 不只是语音转文字。
它通过 LLM 将口语重写为适合当前场景的书面文本,支持在输入过程中用自然语言直接修改、删除、整理已有内容。
其他功能包括单次 5 分钟以上连续录音、50+ 语言自动识别、同一句话内中英文混合输入、自定义热词以及实时翻译。
底层的微软 VibeVoice 是 MIT 协议开源的语音 AI 模型家族,GitHub 星标超 2.8 万,
包含 7B 参数的 ASR 模型(单次处理 60 分钟音频)、1.5B 的 TTS 模型(生成 90 分钟多人语音)和 0.5B 的实时模型(300ms 延迟)。
WisprFlow 是目前 Mac 上最受欢迎的 AI 语音输入工具之一,按月订阅收费,
Vibing 直接以免费 + 开源的方式进入同一赛道。