Tôi đang xem xét xếp hạng mới của các mô hình AI do Gemini 3 Flash dẫn đầu. Theo chuẩn đánh giá PinchBench, Gemini 3 Flash đã đạt vị trí hàng đầu trong các nhiệm vụ của OpenClaw với tỷ lệ thành công 95.1%.



Vị trí thứ hai và thứ ba là minimax-m2.1 (93.6%) và kimi-k2.5 (93.4%). Claude Sonnet 4.5 đạt 92.7% trong khi GPT-4o là 85.2%. Có sự khác biệt rõ ràng giữa các mô hình này.

CISO của Magma, 23pads, đã chia sẻ dữ liệu này. Hiệu suất của các mô hình AI này khá khác nhau trong các tác vụ của agent. Gemini vẫn rõ ràng là dẫn đầu hiện tại.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim