Sóng sâu TechFlow tin tức, ngày 13 tháng 5, đánh giá chuẩn của Trợ lý Giao dịch AI do Manic.Trade phát động, SMART Benchmark, đã chính thức kết thúc. Tổng cộng đã thực hiện 387 lần đánh giá, bao gồm 180 người thử nghiệm, 46 mô hình và hơn 15 họ mô hình, là đánh giá ngang của Trợ lý Giao dịch có nhiều mô hình nhất hiện nay. Chủ yếu tập trung vào năm lĩnh vực: xử lý dữ liệu theo thời gian thực, thu thập tin tức đa nguồn, phân tích thị trường, quyết định giao dịch và kiểm soát rủi ro.Kết quả cho thấy, dòng họ Claude đạt 75.9

DeepFlowTech

2026-05-13 10:03:38

Deep潮 TechFlow Tin tức, ngày 13 tháng 5, đánh giá chuẩn của Agent Giao dịch AI do Manic.Trade phát động đã chính thức kết thúc.
Trong lần đánh giá này, tổng cộng đã thực hiện 387 lần đánh giá, bao gồm 180 người thử nghiệm, 46 mô hình và hơn 15 họ mô hình, là đánh giá ngang hàng của Agent giao dịch có phạm vi bao phủ mô hình lớn nhất hiện nay.
Chủ yếu tập trung vào năm lĩnh vực: xử lý dữ liệu theo thời gian thực, thu thập thông tin đa nguồn, phân tích thị trường, quyết định giao dịch và kiểm soát rủi ro.

Kết quả cho thấy, dòng họ Claude xếp đầu với 75.9 điểm, DeepSeek xếp thứ hai với 74.4 điểm, trong khi dòng họ GPT chỉ đứng thứ chín.
Về mô hình đơn lẻ, Claude 4.7 Opus đạt điểm trung bình cao nhất với 80.8 điểm; DeepSeek V4 Pro xếp thứ hai với 78.6 điểm; Claude 4.6 Opus xếp thứ ba với 78.5 điểm, đồng thời đóng góp duy nhất một thành tích S cấp, điểm tối đa đạt 90/100.

Đáng chú ý, DeepSeek đạt điểm 15.9 trong lĩnh vực Phân tích Thị trường, vượt qua Claude với 15.4.
Manic.Trade cho biết, kết quả đánh giá lần này cho thấy, khoảng cách giữa các Agent Giao dịch AI hiện tại không chủ yếu nằm ở khả năng đưa ra quyết định giao dịch, mà ở khả năng tích hợp thông tin đa nguồn, xử lý dữ liệu có thể xác minh và kiểm soát rủi ro, những khả năng gần hơn với thực thi giao dịch thực tế.

Hiện tại, người dùng có thể truy cập Manic.Trade để xem báo cáo đầy đủ và trải nghiệm thị trường dự đoán giá tiền điện tử dành cho nhà giao dịch con người và Agent AI.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
GateSquareMayTradingShare
1.52M Phổ biến
#
AprilCPIComesInHotterAt3.8%
12.61M Phổ biến
#
IsraelStrikesIranBTCPlunges
46.51K Phổ biến
#
#DailyPolymarketHotspot
911.79K Phổ biến
#
WalshConfirmedAsFedChair
1.98M Phổ biến

Ghim

sơ đồ trang web

GPT xếp thứ 9, DeepSeek vượt qua Claude, Agent giao dịch mạnh nhất chính là 「lỗi thời」 4.6

Chủ đề thịnh hành

GateSquareMayTradingShare

AprilCPIComesInHotterAt3.8%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

WalshConfirmedAsFedChair

Ghim