Grok запускає голосове клонування: запишіть одну хвилину, щоб створити власний голос штучного інтелекту

Згідно з моніторингом від Beating, xAI запустила Grok Custom Voices та Voice Library. Користувачі можуть записати сегмент свого голосу у консолі xAI для створення власного voice_id, який потім можна інтегрувати з Grok TTS або Voice Agent API для застосувань, таких як агенти обслуговування клієнтів, створення контенту, персонажі у іграх та озвучування аудіокниг. Ця функціональність не просто полягає у завантаженні аудіо для клонування. Користувачі повинні прочитати та підтвердити короткі фрази, а система виконує транскрипцію в реальному часі за допомогою STT і порівнює характеристики голосу з запису підтвердження з повним записом, щоб підтвердити, що це одна й та сама особа, перш ніж створити голос. xAI заявляє, що це запобігає клонуванню голосів інших осіб за допомогою вже існуючих записів. Наразі Custom Voices доступні лише у Сполучених Штатах, за винятком Іллінойсу. Консоль дозволяє безкоштовно створювати до 30 власних голосів, тоді як можливості створення через API доступні лише для команд Enterprise. За самі голоси додаткової плати не стягується, але використання голосового API оплачується за фактом: у реальному часі — $3.00 за годину, а Text to Speech — $4.20 за мільйон символів.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити