Chỉ số lập trình viên AI đầu tiên được công bố: Cursor kết hợp Opus 4.7 giành chiến thắng sát sao trước Codex để lên ngôi

robot
Đang tạo bản tóm tắt

Thông tin từ trang币界网, nền tảng phân tích trí tuệ nhân tạo đã công bố Chỉ số chuẩn tổng hợp mã hóa trí tuệ nhân tạo đầu tiên (coding agent index). Chỉ số này tổng hợp ba bài kiểm tra gồm tạo mã, thao tác trên terminal và câu hỏi kỹ thuật, nhằm đánh giá hiệu suất thực tế của các lập trình viên AI. Trong đợt đánh giá đầu tiên, Cursor CLI kết hợp với mô hình Opus 4.7 đạt 61 điểm đứng đầu bảng, vượt xa OpenAI Codex (kết hợp GPT-5.5) và Claude Code của Anthropic (kết hợp Opus 4.7) với lợi thế 1 điểm. Cũng sử dụng mô hình Opus 4.7, điểm của Cursor CLI cao hơn một chút so với Claude Code chính thức, nhưng đổi lại thời gian trung bình cho mỗi nhiệm vụ lâu hơn (7.8 phút so với 5.8 phút), chi phí gọi API cũng cao hơn (1.47 USD so với 1.24 USD). Mức tiết kiệm nhất là Composer 2 tích hợp trong Cursor, chỉ tốn 0.07 USD cho mỗi nhiệm vụ. DeepSeek V4 Pro và Kimi K2.6 theo sau, nhưng các mô hình nội địa này chạy tốn thời gian rõ ràng lâu hơn.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim