据动察 Beating 監測、xAI は Grok カスタムボイスと Voice Library をリリースしました。ユーザーは xAI コントロールパネルで音声を録音し、自分の voice_id を生成、その後 Grok TTS や Voice Agent API に接続して、カスタマーサポートエージェント、コンテンツ制作、ゲームキャラクター、オーディオブックのナレーションなどのシーンで使用できます。この機能は単に音声をアップロードしてクローンするだけではありません。ユーザーは朗読検証用の短いフレーズを読み上げる必要があり、システムはリアルタイムの音声認識(STT)を用いて書き起こしを行い、録音と完全な録音の話者特徴を比較して、同一人物であることを確認した後に声線を生成します。xAI は、これにより既存の録音を使った他人の声のクローンを防止できると述べています。現在、カスタムボイスはアメリカ国内のみで利用可能で、イリノイ州を除きます。コントロールパネルでは最大30のカスタムボイスを無料で作成でき、APIによる作成機能はエンタープライズチームのみに限定されています。カスタムボイス自体には追加料金はかかりませんが、音声APIの呼び出しは従量制です:リアルタイムは$3.00/時間、テキスト読み上げは$4.20/百万文字です。
Grokが音声クローンをリリース:1分間の録音で自分だけのAI声を作成
据动察 Beating 監測、xAI は Grok カスタムボイスと Voice Library をリリースしました。ユーザーは xAI コントロールパネルで音声を録音し、自分の voice_id を生成、その後 Grok TTS や Voice Agent API に接続して、カスタマーサポートエージェント、コンテンツ制作、ゲームキャラクター、オーディオブックのナレーションなどのシーンで使用できます。
この機能は単に音声をアップロードしてクローンするだけではありません。ユーザーは朗読検証用の短いフレーズを読み上げる必要があり、システムはリアルタイムの音声認識(STT)を用いて書き起こしを行い、録音と完全な録音の話者特徴を比較して、同一人物であることを確認した後に声線を生成します。xAI は、これにより既存の録音を使った他人の声のクローンを防止できると述べています。
現在、カスタムボイスはアメリカ国内のみで利用可能で、イリノイ州を除きます。コントロールパネルでは最大30のカスタムボイスを無料で作成でき、APIによる作成機能はエンタープライズチームのみに限定されています。カスタムボイス自体には追加料金はかかりませんが、音声APIの呼び出しは従量制です:リアルタイムは$3.00/時間、テキスト読み上げは$4.20/百万文字です。