Indeks programmer AI pertama dirilis: Cursor dengan Opus 4.7 hampir mengalahkan Codex dan menduduki puncak

robot
Pembuatan abstrak sedang berlangsung

Berita dari CoinWorld, platform analisis kecerdasan buatan merilis indeks standar komprehensif agen pengkodean pertama (coding agent index). Indeks ini menggabungkan tiga pengujian: pembuatan kode, operasi terminal, dan tanya jawab teknis, untuk menilai kinerja nyata programmer AI. Dalam evaluasi awal, Cursor CLI dipadukan dengan model Opus 4.7 meraih skor tertinggi dengan 61 poin, unggul satu poin dari Codex OpenAI (dipadukan dengan GPT-5.5) dan Claude Code dari Anthropic (dipadukan dengan Opus 4.7). Dengan menggunakan model Opus 4.7 yang sama, skor Cursor CLI sedikit lebih tinggi daripada Claude Code resmi, tetapi dengan biaya waktu rata-rata per tugas yang lebih lama (7,8 menit versus 5,8 menit), dan biaya panggilan API yang juga lebih tinggi (1,47 dolar AS versus 1,24 dolar AS). Yang paling hemat biaya adalah Composer 2 bawaan Cursor, dengan biaya per tugas hanya 0,07 dolar AS. DeepSeek V4 Pro dan Kimi K2.6 mengikuti di belakang, tetapi model-model domestik ini membutuhkan waktu yang jauh lebih lama saat dijalankan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan