Эта модель распознавания речи может даже улавливать микровыражения, миллионы комбинаций личностей, в будущем виртуальные ведущие, вероятно, станут трудно отличимы от настоящих.

Посмотреть Оригинал
MeNews
StepAudio 2.5 — публикация голосовых сообщений в реальном времени: восприятие вторичного языка и персонализированное взаимодействие
StepAudio 2.5 Realtime — это модель для распознавания речи в реальном времени, способная определять такие параязыковые характеристики, как интонация, скорость речи, паузы и микроэкспрессии. Через API можно подключать настраиваемые личности, задавать характер, фоновые истории и стиль речи, имея более десяти тысяч вариантов исходных личностей, а комбинации могут достигать миллионов характеристик. Встроены 5 предустановленных личностей, откалиброванных с помощью RLHF, что позволяет сохранять последовательность даже в сложных сценариях ролевых игр, поддерживаются китайский и английский языки.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено