Одна й та сама технологічна платформа для Grok Voice, Tesla, Starlink, Ілон Маск грає дуже амбітно — створюється замкнена екосистема голосу.

Переглянути оригінал
MeNews
xAI випустила API для голосового перетворення в текст і тексту в голос від Grok
ME News повідомляє, що xAI офіційно запустила дві окремі аудіо API — Grok STT та Grok TTS. Grok STT має високу точність, низьку затримку, підтримує пакетну обробку через REST, реальнечасове транскрибування через WebSocket, має часові мітки на рівні слова, розділення мовця, багатоканальність та інтелектуальну нормалізацію тексту, охоплює понад 25 мов; пакетна обробка — 0,10 долара США за годину, потокова — 0,20 долара США за годину, помилка розпізнавання слів краща за кілька конкурентів. Grok TTS забезпечує швидкий, природний голос, який можна тонко налаштовувати за допомогою тегів, ціна — 4,20 долара за мільйон символів. Обидва базуються на одній технологічній платформі і використовуються для Grok Voice, Tesla та Starlink.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено