Grok запускает голосовое клонирование: запишите одну минуту, чтобы создать свой собственный ИИ-голос

Согласно мониторингу компании Beating, xAI запустила Grok Custom Voices и Voice Library. Пользователи могут записать сегмент своего голоса в консоли xAI для создания собственного voice_id, который затем можно интегрировать с Grok TTS или Voice Agent API для приложений, таких как агенты службы поддержки, создание контента, игровые персонажи и озвучивание аудиокниг. Эта функция не ограничивается простым загрузкой аудио для клонирования. Пользователи должны читать и подтверждать короткие фразы, при этом система выполняет транскрипцию в реальном времени с помощью STT и сравнивает характеристики говорящего в записи для подтверждения, что это тот же человек, прежде чем создать голос. xAI заявляет, что это предотвращает клонирование голосов других людей с помощью уже существующих записей. В настоящее время Custom Voices доступны только в США, за исключением Иллинойса. Консоль позволяет бесплатно создавать до 30 пользовательских голосов, в то время как возможности создания через API доступны только командам Enterprise. За сами пользовательские голоса дополнительная плата не взимается, однако использование голосового API оплачивается по мере использования: в реальном времени — 3,00 доллара в час, и Text to Speech — 4,20 доллара за миллион символов.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить