智谱AI发布视觉编码模型GLM-5V-Turbo

robot
摘要生成中

ME News 消息,4 月 2 日(UTC+8),智谱AI近日发布了新一代基础模型GLM-5V-Turbo,该模型旨在弥合视觉感知与软件工程之间的差距。与仅依赖文本提示的标准大语言模型不同,GLM-5V-Turbo原生支持处理设计稿、截图等视觉输入,被定位为"视觉编码模型"。据文中观点,该模型具备原生多模态编码能力,能够理解图像、视频、设计稿和文档布局等多种输入,并在视觉与编程能力的平衡方面,于核心基准测试中取得了领先性能。(来源:InFoQ)

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论