1M AI Newsによるモニタリングによると、GoogleはiOS向けに「Google AI Edge Eloquent」という無料のディクテーション(音声入力)アプリを静かにリリースし、オフライン機能を強調しています。Gemmaベースの音声認識モデルをダウンロードした後、ユーザーはインターネットに接続できない環境でもアプリを利用できます。アプリは文字起こしテキストをリアルタイムで表示し、発話を一時停止した後に「um」や「ah」といったフィラー(つなぎ)語を自動的に除外し、テキストを筋の通った書き言葉に整えます。また、画面下部には4つの書き換えオプションが用意されています。「Key Point Extraction」「Formal」「Concise」「Detailed」です。アプリは初期設定でクラウドモードになっており、テキストのクリーニングにGeminiモデルを使用します。オフにすると、すべての処理がローカルで行われます。ユーザーはGmailアカウントから専門用語、固有名詞、その他のキーワードを取り込んだり、自分でカスタムの語彙を手動で追加したりできます。アプリはディクテーションの履歴も記録し、検索にも対応しており、各ディクテーションセッションについて単語数と話速を表示します。現時点でEloquentはiOSのみで利用可能ですが、App Storeの説明にはAndroid版が言及されており、システムのデフォルトキーボードとして設定できるほか、AIディクテーションアプリWispr FlowのAndroid版と同様のフローティングボタンのショートカットも提供される予定です。Googleは、TechCrunchのコメント依頼にまだ応じていません。
Googleは、ローカルなテキストの洗練にGemmaモデルを使用したオフラインAI音声入力アプリ「Eloquent」をリリース
1M AI Newsによるモニタリングによると、GoogleはiOS向けに「Google AI Edge Eloquent」という無料のディクテーション(音声入力)アプリを静かにリリースし、オフライン機能を強調しています。Gemmaベースの音声認識モデルをダウンロードした後、ユーザーはインターネットに接続できない環境でもアプリを利用できます。アプリは文字起こしテキストをリアルタイムで表示し、発話を一時停止した後に「um」や「ah」といったフィラー(つなぎ)語を自動的に除外し、テキストを筋の通った書き言葉に整えます。また、画面下部には4つの書き換えオプションが用意されています。「Key Point Extraction」「Formal」「Concise」「Detailed」です。アプリは初期設定でクラウドモードになっており、テキストのクリーニングにGeminiモデルを使用します。オフにすると、すべての処理がローカルで行われます。ユーザーはGmailアカウントから専門用語、固有名詞、その他のキーワードを取り込んだり、自分でカスタムの語彙を手動で追加したりできます。アプリはディクテーションの履歴も記録し、検索にも対応しており、各ディクテーションセッションについて単語数と話速を表示します。現時点でEloquentはiOSのみで利用可能ですが、App Storeの説明にはAndroid版が言及されており、システムのデフォルトキーボードとして設定できるほか、AIディクテーションアプリWispr FlowのAndroid版と同様のフローティングボタンのショートカットも提供される予定です。Googleは、TechCrunchのコメント依頼にまだ応じていません。