首个AI程序员指数发布:Cursor搭配Opus 4.7险胜Codex登顶

robot
摘要生成中

币界网消息,人工智能分析平台发布了首个编码智能体综合基准指数(coding agent index)。该指数综合了代码生成、终端操作和技术问答三项测试,用来评估AI程序员的真实工程表现。首期评测中,Cursor CLI搭配Opus 4.7模型以61分拿下榜首,以1分优势力压OpenAI的Codex(搭配GPT-5.5)和Anthropic的Claude Code(搭配Opus 4.7)。同样调用Opus 4.7模型,Cursor CLI的得分略高于官方的Claude Code,但代价是单次任务平均耗时更长(7.8分钟对5.8分钟),API调用成本也更高(1.47美元对1.24美元)。最省钱的是Cursor内置的Composer 2,单次任务只要0.07美元DeepSeek V4 Pro和Kimi K2.6紧随其后,但这几款国产模型跑起来耗时明显更长。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论