Новости сети币界: Inworld AI выпустила модель синтеза речи в реальном времени для диалогов TTS-2, которая способна регулировать голос в зависимости от изменения тона диалога. Ее предшественница TTS-1.5 заняла первое место на сторонних платформах оценки, опередив Google и ElevenLabs. TTS-2 добавила четыре ключевые функции, включая восприятие диалогов, руководство по естественной речи, межъязыковую согласованность и создание голоса по тексту. Эта модель поддерживает 15 официальных языков и более 90 экспериментальных языков, уже запущена на платформах Cloudflare, LiveKit, DeepInfra и других. Генеральный директор Kylan Gibbs в интервью Business Insider заявил, что Inworld занимается только моделями и API, не производит потребительские продукты, чтобы избежать конкуренции с клиентами.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить