Звіт з CoinWorld, Inworld AI випустила модель синтезу голосу для реального часу TTS-2, яка може регулювати голос відповідно до зміни тону розмови. Її попередня версія TTS-1.5 посіла перше місце на сторонніх платформах оцінки, випередивши Google та ElevenLabs. TTS-2 додала чотири ключові можливості, включаючи сприйняття діалогу, керівництво природною мовою для голосу, послідовність між мовами та створення голосу з тексту. Модель підтримує 15 офіційних мов і понад 90 експериментальних мов, вже доступна на платформах Cloudflare, LiveKit, DeepInfra та інших. Генеральний директор Kylan Gibbs у інтерв’ю для Business Insider зазначив, що Inworld займається лише моделями та API, не створює споживчі продукти, щоб уникнути конкуренції з клієнтами.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити