GPT xếp thứ 9, DeepSeek vượt qua Claude, Agent giao dịch mạnh nhất chính là 「lỗi thời」 4.6

Deep潮 TechFlow Tin tức, ngày 13 tháng 5, đánh giá chuẩn của Agent Giao dịch AI do Manic.Trade phát động đã chính thức kết thúc.
Trong lần đánh giá này, tổng cộng đã thực hiện 387 lần đánh giá, bao gồm 180 người thử nghiệm, 46 mô hình và hơn 15 họ mô hình, là đánh giá ngang hàng của Agent giao dịch có phạm vi bao phủ mô hình lớn nhất hiện nay.
Chủ yếu tập trung vào năm lĩnh vực: xử lý dữ liệu theo thời gian thực, thu thập thông tin đa nguồn, phân tích thị trường, quyết định giao dịch và kiểm soát rủi ro.

Kết quả cho thấy, dòng họ Claude xếp đầu với 75.9 điểm, DeepSeek xếp thứ hai với 74.4 điểm, trong khi dòng họ GPT chỉ đứng thứ chín.
Về mô hình đơn lẻ, Claude 4.7 Opus đạt điểm trung bình cao nhất với 80.8 điểm; DeepSeek V4 Pro xếp thứ hai với 78.6 điểm; Claude 4.6 Opus xếp thứ ba với 78.5 điểm, đồng thời đóng góp duy nhất một thành tích S cấp, điểm tối đa đạt 90/100.

Đáng chú ý, DeepSeek đạt điểm 15.9 trong lĩnh vực Phân tích Thị trường, vượt qua Claude với 15.4.
Manic.Trade cho biết, kết quả đánh giá lần này cho thấy, khoảng cách giữa các Agent Giao dịch AI hiện tại không chủ yếu nằm ở khả năng đưa ra quyết định giao dịch, mà ở khả năng tích hợp thông tin đa nguồn, xử lý dữ liệu có thể xác minh và kiểm soát rủi ro, những khả năng gần hơn với thực thi giao dịch thực tế.

Hiện tại, người dùng có thể truy cập Manic.Trade để xem báo cáo đầy đủ và trải nghiệm thị trường dự đoán giá tiền điện tử dành cho nhà giao dịch con người và Agent AI.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim