阿里开放下一代旗舰Qwen3.6-Max-Preview预览,主打智能体编程

robot
摘要生成中
ME News 消息,4 月 20 日(UTC+8),据 动察 Beating 监测,阿里千问团队发布 Qwen3.6-Max-Preview,定位是下一代旗舰模型的早期预览版,接替现有的 Qwen3.6-Plus。用户可在 Qwen Studio(chat.qwen.ai)直接对话体验,随后通过阿里云百炼以 qwen3.6-max-preview 的模型名开放 API 调用;接口兼容 OpenAI 的 chat completions、responses 规范以及 Anthropic 的协议。 这一版主要面向智能体编程(agentic coding),让模型像程序员一样自己写代码、运行、看报错、调用工具,完成多步骤编程任务。官方相对前代 Qwen3.6-Plus 给出的提升集中在编程:SkillsBench +9.9、SciCode +10.8、NL2Repo +5.0、Terminal-Bench 2.0 +3.8 分;世界知识与工具调用格式遵循另三项各有 2.3 到 5.3 分的提升。官方自称在 SWE-bench Pro、Terminal-Bench 2.0、SciCode 等六项编程基准上取得最高分,其中 QwenClawBench、QwenWebBench 从命名看是千问自建评测集,需与公开基准分开看。 API 这一侧还新增了 preserve_thinking 选项:打开后消息会保留前几轮的 thinking 内容。推理模型默认每轮只把「本轮思考」返回一次,多轮智能体对话里上下文缺了前面几步的思考,模型重新规划时容易走回头路或忘记自己已经试过什么,这个开关补的就是这个断档。 (来源:BlockBeats)
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论