Bài viết về forecasting RL (học tăng cường dự báo) này khá thú vị.


Có thể hiểu nó làm như sau:
Lấy một loạt các bài toán dự đoán lịch sử đã có kết quả, cho AI quay trở lại thời điểm đó.
Nhưng không thể để nó truy cập trực tiếp vào internet ngày nay, nếu không sẽ thấy trước đáp án.
Vì vậy tác giả đã xây dựng một môi trường "mặt nạ thời gian":
Chỉ tìm kiếm được tài liệu trước thời điểm đó;
Trang web được đọc qua ảnh chụp lịch sử;
Dữ liệu tài chính và xu hướng chỉ cung cấp phần có sẵn tại thời điểm đó.
Sau đó để mô hình tự tra cứu tài liệu, đánh giá bằng chứng, đưa ra xác suất.
Khi kết quả thực tế được tiết lộ, dùng proper scoring rule (quy tắc tính điểm thích hợp) để chấm điểm, sau đó dùng RL để tăng cường quá trình dự đoán tốt hơn.
Điểm thú vị nhất là:
Không phải huấn luyện một câu trả lời, mà là toàn bộ chuỗi hành động dự đoán:
Tra cứu gì, đọc gì, dừng lại khi nào, xử lý bằng chứng mâu thuẫn ra sao, cuối cùng đưa ra xác suất bao nhiêu.
Đặt trong thị trường dự đoán, tôi nghĩ bước đầu không phải để AI tự động giao dịch.
Mà trước hết nên để nó giữ một forecast diary (nhật ký dự báo):
1. Xác suất tại thời điểm đó
2. Bằng chứng đã sử dụng
3. Giá thị trường
4. Có giao dịch hay không
5. Kết quả sau đó
6. Phân loại nguyên nhân sai
Nếu một hệ thống nói 60% trong thời gian dài nhưng thực tế không phải 60%, thì nó chưa phải chiến lược, chỉ biết viết lý do.
Nếu bạn cũng muốn luyện tập "ghi lại dự đoán → chờ kết quả → hiệu chỉnh bản thân", có thể bắt đầu với số tiền nhỏ/mô phỏng, coi nó như nhật ký dự đoán, chứ không phải lời khuyên giao dịch.
Liên kết tôi dùng:

Bài viết gốc ở đây:

Điều tôi thấy đáng xem nhất không phải là bản thân kết luận, mà là nó đã phân tách "dự đoán" thành một quá trình có thể huấn luyện và xem xét lại.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim