Grok запускает голосовое клонирование: запись одной минуты — и вы создаете свой собственный AI-голос

robot
Генерация тезисов в процессе

Согласно мониторингу Beating, xAI запустила Grok Custom Voices и Voice Library.
Пользователи могут записать голос на консоли xAI, создать свой voice_id, а затем подключить его к API Grok TTS или Voice Agent для сценариев обслуживания клиентов, создания контента, игровых персонажей, озвучивания аудиокниг и т. д.

Эта функция не предполагает простое загрузку аудио для клонирования.
Пользователи должны прочитать проверочную фразу, система выполнит распознавание речи в реальном времени с помощью STT и сравнит характеристики говорящего в проверочной и полном аудиозаписях, чтобы подтвердить, что это один и тот же человек, прежде чем создать голос.
xAI утверждает, что это предотвращает клонирование чужого голоса с помощью готовых записей.

В настоящее время Custom Voices доступны только в США, за исключением Иллинойса.
На консоли можно бесплатно создать до 30 пользовательских голосов, возможность создания через API предоставляется только корпоративным командам.
Само создание пользовательских голосов не оплачивается дополнительно, но вызовы голосового API по-прежнему тарифицируются: Realtime — 3,00 доллара США в час, Text to Speech — 4,20 доллара за миллион символов.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить