广场
最新
热门
资讯
我的主页
发布
支持3500个语言对!阿里发布首个视觉增强同传大模型Qwen3.5-LiveTranslate
ME News
2026-06-24 19:06:37
关注
摘要生成中
AIMPACT 消息,5 月 20 日(UTC+8),据 动察 Beating 监测,同传系统正在从单调的语音翻译,进化为能看懂画面、会克隆人声的全模态数字译员。5 月 19 日,阿里通义实验室正式宣布推出新一代实时音视频同传大模型 Qwen3.5-LiveTranslate,将实时同传能力大幅升级至 3500 多个语言对,并首次支持实时声音克隆、热词自定义与视觉理解。 新模型基于 Qwen3.5-Omni 架构,现已支持 60 种语言的理解与写作,以及 29 种语言的语音输出。 不同于传统只听声音的同传软件,新模型引入了实时视觉上下文以消除语义歧义。例如当视频画面中出现特定口罩时,系统能结合视觉特征,在英文中精准区分出医疗口罩与化妆舞会面具,以此弥补声音信息的缺失。 为了消除噪音与口音带来的转录偏差,新模型还引入了热词动态注入机制。原因很简单,用户能在翻译流中直接指定特定人名、品牌或行业术语,强行锁定正确翻译,避免专有名词在同传中发生漂移。 在跨语种同传时,模型还支持实时人声克隆,能够在同传流中实时复现说话人原声的音色与语气。 目前,新模型已在体验平台 Qwen Omni 开放,未来 API 将登录阿里云百炼平台。 (来源:BlockBeats)
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
请输入评论内容
请输入评论内容
评论
暂无评论
热门话题
查看更多
#
0成本拿2股SK海力士
151.48万 热度
#
美光市值超越Meta跻身全美前十
3.3万 热度
#
法国VS挪威
31.69万 热度
#
美国5月PCE通胀升至4.1%创三年新高
52.1万 热度
#
USD1链上质押享年化9.48%
97.85万 热度
置顶
网站地图
支持3500个语言对!阿里发布首个视觉增强同传大模型Qwen3.5-LiveTranslate