Googleは、ローカルなテキストの洗練にGemmaモデルを使用したオフラインAI音声入力アプリ「Eloquent」をリリース

1M AI Newsによるモニタリングによると、GoogleはiOS向けに「Google AI Edge Eloquent」という無料のディクテーション(音声入力)アプリを静かにリリースし、オフライン機能を強調しています。Gemmaベースの音声認識モデルをダウンロードした後、ユーザーはインターネットに接続できない環境でもアプリを利用できます。アプリは文字起こしテキストをリアルタイムで表示し、発話を一時停止した後に「um」や「ah」といったフィラー(つなぎ)語を自動的に除外し、テキストを筋の通った書き言葉に整えます。また、画面下部には4つの書き換えオプションが用意されています。「Key Point Extraction」「Formal」「Concise」「Detailed」です。アプリは初期設定でクラウドモードになっており、テキストのクリーニングにGeminiモデルを使用します。オフにすると、すべての処理がローカルで行われます。ユーザーはGmailアカウントから専門用語、固有名詞、その他のキーワードを取り込んだり、自分でカスタムの語彙を手動で追加したりできます。アプリはディクテーションの履歴も記録し、検索にも対応しており、各ディクテーションセッションについて単語数と話速を表示します。現時点でEloquentはiOSのみで利用可能ですが、App Storeの説明にはAndroid版が言及されており、システムのデフォルトキーボードとして設定できるほか、AIディクテーションアプリWispr FlowのAndroid版と同様のフローティングボタンのショートカットも提供される予定です。Googleは、TechCrunchのコメント依頼にまだ応じていません。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン