这语音模型连微表情都能抓,百万种人格组合,以后虚拟主播怕是要真假难辨了

ME News
StepAudio 2.5实时语音发布:副语言感知与人格化交互
StepAudio 2.5 Realtime是一款实时语音模型,能识别语气、语速、停顿和微表情等副语言特征。通过API可接入自定义人格,设定性格、背景故事与语言风格,拥有上万原生人格选项,组合可达数百万种特征。内置5个预设人格,经RLHF调优,在复杂角色扮演场景中也能保持一致性,支持中文和英文。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论