币界网消息,豆包doubao-seed-2.0-lite升级为全模态理解模型,lite版在多项基准上反超pro,语音识别表现优于Gemini 3.1 Pro。该模型同时处理视频、图像、音频和文本,支持19个语种的语音转写和16个语种的互译。视觉方面,lite新版在物理推理和医疗问答等高阶学科基准上超过了doubao-seed-2.0-pro,并在细粒度感知和具身理解上达到SOTA。模型适配了openclaw、hermes agent等框架,强化多步任务拆解和长程任务稳定性,支持跨应用连续执行业务流程。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论