GoogleDeepMind发布空间感知基础图文编码器TIPSv2

ME News 消息,4 月 15 日(UTC+8),GoogleDeepMind近日在CVPR 2026上发布了TIPSv2,这是一个具备空间感知能力的基础图文编码器。该模型在整体性能上取得了强劲的结果,并在图像块与文本的对齐任务上实现了显著的性能提升。发布方认为,真正的多模态AI需要理解世界的空间关系。(来源:InFoQ)

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论