Grokが音声クローンを開始:1分間の録音で自分だけのAI音声を作成

robot
概要作成中

Beatingの監視によると、xAIはGrokカスタムボイスとボイスライブラリを開始しました。ユーザーはxAIコンソールで自分の声の一部を録音し、独自のvoice_idを生成できます。その後、Grok TTSやVoice Agent APIと連携させて、カスタマーサービスエージェント、コンテンツ制作、ゲームキャラクター、オーディオブックのナレーションなどのアプリケーションに利用できます。この機能は単に音声をアップロードしてクローンするだけのものではありません。ユーザーは短いフレーズを読み上げて確認し、システムはSTTを用いてリアルタイムの文字起こしを行い、確認録音と完全録音の話者特性を比較して、同一人物であることを確認した上で音声を生成します。xAIはこれにより、既存の録音を使った他人の声のクローンを防止していると述べています。現在、カスタムボイスはイリノイ州を除くアメリカ合衆国のみで利用可能です。コンソールでは最大30のカスタムボイスを無料で作成でき、APIによる作成はエンタープライズチームのみが利用可能です。カスタムボイス自体には追加料金はかかりませんが、ボイスAPIの利用は使用量に応じて課金されます:リアルタイムは1時間あたり3.00ドル、テキスト読み上げは100万文字あたり4.20ドルです。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし