1M AI Newsによるモニタリングによれば、Microsoftは、自社のオープンソース音声AIモデルであるVibeVoiceをベースにしたデスクトップ音声入力ツール「Vibing」をリリースしました。macOSとWindowsに対応しており、利用は無料です。ショートカットキーを押すことで(Macは右Option / WindowsはCtrl+Win)、ユーザーは任意のアプリケーション内で録音を開始でき、録音終了後に自動的にテキスト出力されます。AI/MLコミュニティのレビュアーである@realmrfakenameが動作を試し、「文字起こしは正確で速い」と報告し、「WisprFlowの無料代替」と表現しています。Vibingは単なる音声からテキストへのツールではありません。LLMを使って話し言葉を書き言葉に書き換え、現在の文脈に適した形に整えます。入力中に、ユーザーは自然言語で既存のコンテンツを直接修正・削除・整理できるようになっています。その他の機能には、5分以上の連続録音、50以上の言語の自動認識、同じ文の中での中国語と英語の混在入力、ホットワードのカスタマイズ、リアルタイム翻訳があります。基盤となるMicrosoft VibeVoiceは、MITライセンスの下でオープンソース化された音声AIモデル群で、GitHubでは28,000以上のスターを獲得しています。これには、7BパラメータのASRモデル(60分の音声を一度に処理)、1.5BパラメータのTTSモデル(90分間の複数人の音声を生成)、0.5Bのリアルタイムモデル(遅延300ms)が含まれます。WisprFlowは現在、Macで最も人気のあるAI音声入力ツールの一つで、月額サブスクリプションで利用可能ですが、Vibingは「無料かつオープンソース」の選択肢として同じ市場に参入します。
Microsoftは無料の音声入力ツールVibingをリリースし、有料製品WisprFlowと競合しています
1M AI Newsによるモニタリングによれば、Microsoftは、自社のオープンソース音声AIモデルであるVibeVoiceをベースにしたデスクトップ音声入力ツール「Vibing」をリリースしました。macOSとWindowsに対応しており、利用は無料です。ショートカットキーを押すことで(Macは右Option / WindowsはCtrl+Win)、ユーザーは任意のアプリケーション内で録音を開始でき、録音終了後に自動的にテキスト出力されます。AI/MLコミュニティのレビュアーである@realmrfakenameが動作を試し、「文字起こしは正確で速い」と報告し、「WisprFlowの無料代替」と表現しています。Vibingは単なる音声からテキストへのツールではありません。LLMを使って話し言葉を書き言葉に書き換え、現在の文脈に適した形に整えます。入力中に、ユーザーは自然言語で既存のコンテンツを直接修正・削除・整理できるようになっています。その他の機能には、5分以上の連続録音、50以上の言語の自動認識、同じ文の中での中国語と英語の混在入力、ホットワードのカスタマイズ、リアルタイム翻訳があります。基盤となるMicrosoft VibeVoiceは、MITライセンスの下でオープンソース化された音声AIモデル群で、GitHubでは28,000以上のスターを獲得しています。これには、7BパラメータのASRモデル(60分の音声を一度に処理)、1.5BパラメータのTTSモデル(90分間の複数人の音声を生成)、0.5Bのリアルタイムモデル(遅延300ms)が含まれます。WisprFlowは現在、Macで最も人気のあるAI音声入力ツールの一つで、月額サブスクリプションで利用可能ですが、Vibingは「無料かつオープンソース」の選択肢として同じ市場に参入します。