Nổ tung rồi! Các nhà giao dịch AI đồng loạt gặp sự cố, mất một phần ba trong hai tuần, nhà đầu tư nhỏ lẻ còn dám gửi tiền cho máy sao?

Question

Trí tuệ nhân tạo đang gõ cửa Wall Street, nhưng bản báo cáo đầu tiên lại tệ như hiện trường vụ tai nạn.

Một loạt các cuộc thi giao dịch công khai ban đầu cho thấy, các mô hình ngôn ngữ lớn phổ biến trong giao dịch tự động thường thể hiện kém—hầu hết hệ thống đều lỗ, tần suất giao dịch cao đến khó tin, đối mặt cùng một chỉ thị lại đưa ra các quyết định hoàn toàn khác nhau.

Ví dụ điển hình nhất đến từ cuộc thi Alpha Arena do công ty khởi nghiệp công nghệ Nof1 tổ chức. Họ đưa vào bảy hệ thống AI tiên tiến như Claude của Anthropic, Gemini của Google, ChatGPT của OpenAI, Grok của Elon Musk cùng các hệ thống khác, tham gia bốn vòng thi, mỗi vòng trước khi bắt đầu cấp cho mỗi mô hình 10.000 USD, để chúng tự giao dịch cổ phiếu công nghệ Mỹ trong hai tuần.

Kết quả thế nào? Tổng danh mục đầu tư lỗ khoảng một phần ba. Trong 32 kết quả giao dịch, chỉ có 6 lần có lợi nhuận. Người sáng lập Nof1, Jay Azhang, thẳng thắn: “Bây giờ giao tiền trực tiếp cho các mô hình lớn để tự giao dịch, con đường đó không thể đi tiếp.”

Dữ liệu cho thấy những hạn chế nhiều mặt của AI trong các tình huống giao dịch hiện nay. Cùng một lệnh gợi ý, Qwen của Alibaba thực hiện 1.418 lệnh trong một vòng, trong khi hệ thống tốt nhất là Grok chỉ thực hiện 158 lệnh. Thành tích tốt nhất của Grok xuất hiện trong vòng mà nó có thể quan sát được hiệu suất của các đối thủ cạnh tranh.

Blog Flat Circle theo dõi 11 thị trường liên quan, kết quả cho thấy mỗi thị trường đều có ít nhất một mô hình đạt lợi nhuận, nhưng chỉ có hai thị trường có mô hình trung vị đạt lợi nhuận dương—đa số các mô hình không thể vượt thị trường.

Sự khác biệt trong quyết định giữa các mô hình còn gây đau đầu hơn. Azhang cho biết, trong vòng thử nghiệm mới nhất của Alpha Arena, Claude thiên về mua vào, Gemini không ngần ngại bán khống, còn Qwen thích chơi cược đòn bẩy cao.

Người phụ trách quỹ dựa trên LLM, Doug Clinton của Intelligent Alpha, nói: “Chúng đều có ‘cá tính’, quản lý gần như giống như quản lý một nhà phân tích con người.” Tuy nhiên, bằng cách thông báo cho mô hình biết nó có thể có những thiên lệch nhất định, kết quả có thể được cải thiện phần nào.

Azhang chỉ ra, các mô hình lớn có lợi thế trong nghiên cứu và gọi công cụ, nhưng về mặt thực thi giao dịch lại rõ ràng có điểm yếu: chúng không hiểu rõ các biến như xếp hạng của nhà phân tích, giao dịch nội gián, biến động tâm lý, nên dễ mua đỉnh, bán đáy, quản lý vị thế kém.

Bài kiểm tra tiêu chuẩn của Intelligent Alpha cung cấp một tham chiếu tích cực tương đối. Họ cung cấp cho 10 mô hình AI quyền truy cập vào tài liệu tài chính, dự báo của nhà phân tích, ghi chú cuộc họp báo cáo tài chính, dữ liệu kinh tế vĩ mô và tìm kiếm trực tuyến, chỉ để xác định hướng dự báo lợi nhuận. Đến quý IV năm 2025, độ chính xác dự báo của ChatGPT đạt 68%, thành tích tốt nhất. Clinton cho biết, mỗi lần ra mắt phiên bản mới, hiệu suất của mô hình đều có xu hướng cải thiện.

Có một rào cản phương pháp luận căn bản trong việc đánh giá khả năng giao dịch của AI: các chiến lược định lượng truyền thống dựa vào kiểm thử lịch sử, nhưng hầu như không hiệu quả với các mô hình lớn—một mô hình được hỏi cách giao dịch trong tháng 3 năm 2020 đã “biết” rõ xu hướng của quá khứ đó từ lâu. Hiện tượng “thiên lệch dự báo trước” này buộc các nhà nghiên cứu phải đánh giá qua thực chiến, dẫn đến sự xuất hiện tràn lan của các cuộc thi.

Tác giả blog Flat Circle, cựu đồng sáng lập công ty dữ liệu thay thế YipitData, Jim Moran, cho rằng, hiện tại phần lớn các thử nghiệm công khai đều quá ngắn hạn, nhiễu quá lớn, chưa đủ để rút ra kết luận chắc chắn. Các cuộc thi này còn có nhược điểm tự nhiên như không có quyền truy cập vào nguồn nghiên cứu cổ phiếu độc quyền, chất lượng thực thi thấp. Ông nói: “Nếu đem một AI trong các cuộc thi này trực tiếp chuyển vào vận hành trong một quỹ phòng hộ hàng đầu, hiệu quả chắc chắn sẽ tốt hơn.”

Cựu trưởng bộ phận khoa học dữ liệu của Coatue Management, hiện làm việc tại NX1 Capital, Alexander Izydorczyk, gần đây viết rằng, trong các robot giao dịch AI mà ông theo dõi, chưa có ai thể hiện khả năng sinh lợi bền vững vượt trội. Ông cho rằng, hạn chế của các cuộc thi này nằm ở chỗ dữ liệu huấn luyện thiếu các kỹ thuật định lượng thực tế mà các tổ chức giao dịch bí mật sử dụng.

Tuy nhiên, ông để lại một nhận định đáng suy ngẫm: “Người mới bắt đầu đôi khi có thể nhìn thấy những thứ mà người lão luyện không thấy.” Trong blog cá nhân, ông viết: “Khi các đại lý chiến lược giao dịch dựa trên mô hình lớn thực sự bắt đầu phát huy hiệu quả, bạn sẽ không nghe thấy tin gì ngay lập tức.”

Nof1 đang chuẩn bị mùa thứ hai của Alpha Arena, dự kiến sẽ cung cấp khả năng tìm kiếm trên mạng, thời gian suy nghĩ dài hơn, nhiều nguồn dữ liệu hơn và khả năng thực thi nhiều bước. Nhưng mô hình kinh doanh cốt lõi của công ty là cung cấp hệ thống công cụ xây dựng đại lý giao dịch AI cho nhà đầu tư cá nhân—chứ không phải trực tiếp đưa AI vào sàn giao dịch.

Chính định hướng này, có lẽ đã là lời nhắc nhở thực tế nhất về khả năng giao dịch AI hiện tại.

Nổ tung rồi! Các nhà giao dịch AI đồng loạt gặp sự cố, mất một phần ba trong hai tuần, nhà đầu tư nhỏ lẻ còn dám gửi tiền cho máy sao?

Chủ đề thịnh hành

GateSquareMayTradingShare

BTCPullback

IsraelStrikesIranBTCPlunges

CLARITYActStalled

CryptoStocksRally

Ghim