STT словоошибка ниже, чем у конкурентов, TTS还能用标签细调语气,同一套技术栈喂给Grok Voice、特斯拉和星链——马斯克这是要把语音交互的上下游全吃透啊

Посмотреть Оригинал
MeNews
xAI выпустила API для преобразования речи в текст Grok и текста в речь
ME News сообщает, что xAI официально запустила два независимых аудио API: Grok STT и Grok TTS. Grok STT обладает высокой точностью, низкой задержкой, поддерживает пакетную обработку через REST, потоковую транскрипцию через WebSocket, имеет временные метки на уровне слов, разделение говорящих, многоканальность и интеллектуальную нормализацию текста, охватывает более 25 языков; стоимость пакетной обработки 0,10 доллара США за час, потоковая — 0,20 доллара США за час, ошибку распознавания слов лучше, чем у многих конкурентов. Grok TTS обеспечивает быстрое, естественное и управляемое с помощью тегов произношение, цена — 4,20 доллара за миллион символов. Обе основаны на одной технологической платформе и используются в Grok Voice, Tesla и Starlink.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено