1M AI News のモニタリングによると、Google が iOS で「Google AI Edge Eloquent」という無料の音声書き起こしアプリを公開し、オフライン優先を売りにしている。ユーザーは Gemma に基づく音声認識モデルをダウンロードすれば、ネットワーク環境なしでも利用できる。アプリは書き起こしテキストをリアルタイムで表示し、停止すると「えー」「あー」などのフィラー(つなぎ言葉)を自動的にフィルタリングして、読みやすい文章として整える。さらに画面下部には、「要点の抽出」「フォーマル」「簡潔」「詳細」の4種類のテキスト言い換えオプションも用意されている。 アプリはデフォルトでクラウドモードを有効にしており、この場合は Gemini モデルでテキストをクリーンアップする。有効を切ると、処理は完全にローカルで行われる。ユーザーは Gmail アカウントから専門用語や固有名詞などのキーワードを取り込めるほか、手動でカスタム語彙を追加することもできる。アプリは書き起こし履歴も記録し、検索にも対応しており、各回の書き起こしの単語数と話速を表示する。 現在 Eloquent は iOS のみで提供されているが、App Store の説明文には Android バージョンに言及があり、システム標準のキーボードとして設定できるようになり、さらにフローティングボタンによるクイックアクセスも提供するとしている。これは、AI 音声書き起こしアプリ Wispr Flow の Android 版の機能と似ているという。Google は TechCrunch からのコメント依頼にまだ応じていない。
Googleは静かにオフラインAI音声認識アプリ「Eloquent」をリリースし、Gemmaモデルを使用してローカルで口癖をフィルタリングし、テキストをブラッシュアップします
1M AI News のモニタリングによると、Google が iOS で「Google AI Edge Eloquent」という無料の音声書き起こしアプリを公開し、オフライン優先を売りにしている。ユーザーは Gemma に基づく音声認識モデルをダウンロードすれば、ネットワーク環境なしでも利用できる。アプリは書き起こしテキストをリアルタイムで表示し、停止すると「えー」「あー」などのフィラー(つなぎ言葉)を自動的にフィルタリングして、読みやすい文章として整える。さらに画面下部には、「要点の抽出」「フォーマル」「簡潔」「詳細」の4種類のテキスト言い換えオプションも用意されている。
アプリはデフォルトでクラウドモードを有効にしており、この場合は Gemini モデルでテキストをクリーンアップする。有効を切ると、処理は完全にローカルで行われる。ユーザーは Gmail アカウントから専門用語や固有名詞などのキーワードを取り込めるほか、手動でカスタム語彙を追加することもできる。アプリは書き起こし履歴も記録し、検索にも対応しており、各回の書き起こしの単語数と話速を表示する。
現在 Eloquent は iOS のみで提供されているが、App Store の説明文には Android バージョンに言及があり、システム標準のキーボードとして設定できるようになり、さらにフローティングボタンによるクイックアクセスも提供するとしている。これは、AI 音声書き起こしアプリ Wispr Flow の Android 版の機能と似ているという。Google は TechCrunch からのコメント依頼にまだ応じていない。