Beatingの監視によると、xAIはGrokカスタムボイスとボイスライブラリを開始しました。ユーザーはxAIコンソールで自分の声の一部を録音し、独自のvoice_idを生成できます。その後、Grok TTSやVoice Agent APIと連携して、カスタマーサービスエージェント、コンテンツ制作、ゲームキャラクター、オーディオブックナレーションなどのアプリケーションに利用できます。この機能は単に音声をアップロードしてクローンするだけのものではありません。ユーザーは短いフレーズを読み上げて確認し、システムはSTTを用いてリアルタイムの文字起こしを行い、確認録音と完全録音の話者特性を比較して、同一人物であることを確認した上で音声を生成します。xAIはこれにより、既存の録音を使った他人の声のクローンを防止していると述べています。現在、カスタムボイスはイリノイ州を除くアメリカ合衆国のみで利用可能です。コンソールでは最大30のカスタムボイスを無料で作成でき、APIによる作成機能はエンタープライズチームのみが利用可能です。カスタムボイス自体には追加料金はかかりませんが、ボイスAPIの利用は使用量に応じて課金されます:リアルタイムは1時間あたり3.00ドル、テキスト読み上げは100万文字あたり4.20ドルです。
Grokが音声クローンを開始:1分間の録音で自分だけのAI音声を作成
Beatingの監視によると、xAIはGrokカスタムボイスとボイスライブラリを開始しました。ユーザーはxAIコンソールで自分の声の一部を録音し、独自のvoice_idを生成できます。その後、Grok TTSやVoice Agent APIと連携して、カスタマーサービスエージェント、コンテンツ制作、ゲームキャラクター、オーディオブックナレーションなどのアプリケーションに利用できます。この機能は単に音声をアップロードしてクローンするだけのものではありません。ユーザーは短いフレーズを読み上げて確認し、システムはSTTを用いてリアルタイムの文字起こしを行い、確認録音と完全録音の話者特性を比較して、同一人物であることを確認した上で音声を生成します。xAIはこれにより、既存の録音を使った他人の声のクローンを防止していると述べています。現在、カスタムボイスはイリノイ州を除くアメリカ合衆国のみで利用可能です。コンソールでは最大30のカスタムボイスを無料で作成でき、APIによる作成機能はエンタープライズチームのみが利用可能です。カスタムボイス自体には追加料金はかかりませんが、ボイスAPIの利用は使用量に応じて課金されます:リアルタイムは1時間あたり3.00ドル、テキスト読み上げは100万文字あたり4.20ドルです。