Googleは静かにオフラインAI音声認識アプリ「Eloquent」をリリースし、Gemmaモデルを使用してローカルで口癖をフィルタリングし、テキストをブラッシュアップします

robot
概要作成中

1M AI News のモニタリングによると、Google が iOS で「Google AI Edge Eloquent」という無料の音声書き起こしアプリを公開し、オフライン優先を売りにしている。ユーザーは Gemma に基づく音声認識モデルをダウンロードすれば、ネットワーク環境なしでも利用できる。アプリは書き起こしテキストをリアルタイムで表示し、停止すると「えー」「あー」などのフィラー(つなぎ言葉)を自動的にフィルタリングして、読みやすい文章として整える。さらに画面下部には、「要点の抽出」「フォーマル」「簡潔」「詳細」の4種類のテキスト言い換えオプションも用意されている。

アプリはデフォルトでクラウドモードを有効にしており、この場合は Gemini モデルでテキストをクリーンアップする。有効を切ると、処理は完全にローカルで行われる。ユーザーは Gmail アカウントから専門用語や固有名詞などのキーワードを取り込めるほか、手動でカスタム語彙を追加することもできる。アプリは書き起こし履歴も記録し、検索にも対応しており、各回の書き起こしの単語数と話速を表示する。

現在 Eloquent は iOS のみで提供されているが、App Store の説明文には Android バージョンに言及があり、システム標準のキーボードとして設定できるようになり、さらにフローティングボタンによるクイックアクセスも提供するとしている。これは、AI 音声書き起こしアプリ Wispr Flow の Android 版の機能と似ているという。Google は TechCrunch からのコメント依頼にまだ応じていない。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン