币界网推出首个编码智能体综合基准指数，综合代码生成、终端操作和技术问答，评估AI程序员真实工程能力。首期评测中，Cursor CLI搭配Opus 4.7以61分夺冠，领先OpenAI Codex（GPT-5.5）和Anthropic Claude Code（Opus 4.7）1分。同模型下Cursor CLI分数略高于Claude Code，但单次任务耗时更长（7.8分钟对5.8分钟），API成本也更高（1.47美元对1.24美元）。最省钱的是Cursor内置的Composer 2，单次任务仅0.07美元，DeepSeek V4 Pro和Kimi K2.6紧随其后，但耗时明显更长。

币界网

2026-05-12 00:42:04

摘要生成中

币界网消息，人工智能分析平台发布了首个编码智能体综合基准指数（coding agent index）。该指数综合了代码生成、终端操作和技术问答三项测试，用来评估AI程序员的真实工程表现。首期评测中，Cursor CLI搭配Opus 4.7模型以61分拿下榜首，以1分优势力压OpenAI的Codex（搭配GPT-5.5）和Anthropic的Claude Code（搭配Opus 4.7）。同样调用Opus 4.7模型，Cursor CLI的得分略高于官方的Claude Code，但代价是单次任务平均耗时更长（7.8分钟对5.8分钟），API调用成本也更高（1.47美元对1.24美元）。最省钱的是Cursor内置的Composer 2，单次任务只要0.07美元DeepSeek V4 Pro和Kimi K2.6紧随其后，但这几款国产模型跑起来耗时明显更长。

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

请输入评论内容

暂无评论

热门话题
查看更多
#
Gate广场五月交易分享
134.61万热度
#
TROLL两日涨超160%
856.79万热度
#
Polymarket每日热点
27.56万热度
#
铭文浏览器Ordio关闭
125.19万热度
#
特朗普5月13日访华
2588.33万热度

首个AI程序员指数发布：Cursor搭配Opus 4.7险胜Codex登顶

热门话题

Gate广场五月交易分享

TROLL两日涨超160%

Polymarket每日热点

铭文浏览器Ordio关闭

特朗普5月13日访华

置顶