Grok запускає голосове клонування: записати одну хвилину — і можна створити свій власний AI-голос

robot
Генерація анотацій у процесі

Згідно з моніторингом Beating, xAI запустила Grok Custom Voices та Voice Library.
Користувачі можуть записати голос у консолі xAI, створити свій voice_id, а потім підключити до Grok TTS або Voice Agent API, використовувати для обслуговування клієнтів, створення контенту, ігрових персонажів, аудіокниг тощо.

Ця функція не полягає у простому завантаженні аудіо для клону.
Користувачі повинні прочитати підтверджувальні короткі фрази, система використовує STT для реального часу транскрипції та порівнює характеристики мовлення у підтверджувальній та повній записах, щоб переконатися, що це один і той самий людина, перед тим як створити голос.
xAI стверджує, що це запобігає використанню готових записів для клонування голосу інших людей.

Зараз Custom Voices доступні лише у США, за винятком штату Іллінойс.
Консоль може безкоштовно створити до 30 власних голосів, можливість створення через API доступна лише для команд Enterprise.
Самі власні голоси не мають додаткової оплати, але виклики голосового API все ще оплачуються за обсягом: Realtime — $3.00/година, Text to Speech — $4.20 за мільйон символів.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити