币界网消息,人工智能分析平台发布了首个编码智能体综合基准指数(coding agent index)。 この指数は、コード生成、端末操作、技術質問の3つのテストを総合し、AIプログラマーの実際のエンジニアリングパフォーマンスを評価するためのものです。 首期评测中,Cursor CLI搭配Opus 4.7模型以61分拿下榜首,以1分优势力压OpenAI的Codex(搭配GPT-5.5)和Anthropic的Claude Code(搭配Opus 4.7)。 最初の評価では、Cursor CLIはOpus 4.7モデルと組み合わせて61点を獲得し、トップに立った。OpenAIのCodex(GPT-5.5と組み合わせ)とAnthropicのClaude Code(Opus 4.7と組み合わせ)を1点差で抑えた。 同样调用Opus 4.7模型,Cursor CLI的得分略高于官方的Claude Code,但代价是单次任务平均耗时更长(7.8分钟对5.8分钟),API调用成本也更高(1.47美元对1.24美元)。 同じくOpus 4.7モデルを使用して、Cursor CLIのスコアは公式のClaude Codeよりやや高いが、その代償として1回のタスクの平均所要時間は長く(7.8分対5.8分)、API呼び出しコストも高い(1.47ドル対1.24ドル)。 最省钱的是Cursor内置的Composer 2,单次任务只要0.07美元DeepSeek V4 Pro和Kimi K2.6紧随其后,但这几款国产模型跑起来耗时明显更长。 最もコストを抑えられるのは、Cursorに内蔵されたComposer 2で、1回のタスクにかかる費用はわずか0.07ドル。DeepSeek V4 ProとKimi K2.6が続くが、これらの国産モデルは実行時間が明らかに長い。
最初のAIプログラマー指数が発表される:CursorとOpus 4.7の組み合わせがCodexをわずかに上回りトップに
币界网消息,人工智能分析平台发布了首个编码智能体综合基准指数(coding agent index)。
この指数は、コード生成、端末操作、技術質問の3つのテストを総合し、AIプログラマーの実際のエンジニアリングパフォーマンスを評価するためのものです。
首期评测中,Cursor CLI搭配Opus 4.7模型以61分拿下榜首,以1分优势力压OpenAI的Codex(搭配GPT-5.5)和Anthropic的Claude Code(搭配Opus 4.7)。
最初の評価では、Cursor CLIはOpus 4.7モデルと組み合わせて61点を獲得し、トップに立った。OpenAIのCodex(GPT-5.5と組み合わせ)とAnthropicのClaude Code(Opus 4.7と組み合わせ)を1点差で抑えた。
同样调用Opus 4.7模型,Cursor CLI的得分略高于官方的Claude Code,但代价是单次任务平均耗时更长(7.8分钟对5.8分钟),API调用成本也更高(1.47美元对1.24美元)。
同じくOpus 4.7モデルを使用して、Cursor CLIのスコアは公式のClaude Codeよりやや高いが、その代償として1回のタスクの平均所要時間は長く(7.8分対5.8分)、API呼び出しコストも高い(1.47ドル対1.24ドル)。
最省钱的是Cursor内置的Composer 2,单次任务只要0.07美元DeepSeek V4 Pro和Kimi K2.6紧随其后,但这几款国产模型跑起来耗时明显更长。
最もコストを抑えられるのは、Cursorに内蔵されたComposer 2で、1回のタスクにかかる費用はわずか0.07ドル。DeepSeek V4 ProとKimi K2.6が続くが、これらの国産モデルは実行時間が明らかに長い。