STT помилка в словах нижча ніж у конкурентів, TTS ще можна тонко налаштувати інтонацію за допомогою тегів, одна й та сама технологічна платформа подається до Grok Voice, Tesla та Starlink — Ілон Маск прагне повністю опанувати всі етапи голосової взаємодії

Переглянути оригінал
MeNews
xAI випустила API для голосового перетворення в текст і тексту в голос від Grok
ME News повідомляє, що xAI офіційно запустила дві окремі аудіо API — Grok STT та Grok TTS. Grok STT має високу точність, низьку затримку, підтримує пакетну обробку через REST, реальнечасове транскрибування через WebSocket, має часові мітки на рівні слова, розділення мовців, багатоканальність та інтелектуальну нормалізацію тексту, що охоплює понад 25 мов; пакетна обробка — 0,10 долара США за годину, потокова — 0,20 долара США за годину, помилка в словах краща за багато конкурентів. Grok TTS пропонує швидкий, природний голос із можливістю тонкого налаштування через теги, ціна — 4,20 долара за мільйон символів. Обидва базуються на одній технологічній платформі і використовуються для Grok Voice, Tesla та Starlink.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено