Artikel tentang peramalan penguatan pembelajaran RL ini cukup menarik.



Yang dilakukannya bisa dipahami seperti ini:
Ambil sekumpulan soal prediksi historis yang sudah memiliki hasil, lalu biarkan AI kembali ke titik waktu saat itu.

Namun tidak boleh membiarkannya langsung mengakses internet hari ini, karena akan melihat jawabannya.

Maka penulis membuat lingkungan "penutup waktu":
Pencarian hanya bisa mencari materi sebelum waktu itu;
Halaman web dibaca melalui snapshot historis;
Data keuangan dan tren juga hanya memberikan bagian yang terlihat saat itu.

Kemudian biarkan model mencari informasinya sendiri, menilai bukti, dan mengeluarkan probabilitas.

Setelah hasil nyata terungkap, beri skor menggunakan proper scoring rule, lalu gunakan RL untuk memperkuat proses prediksi yang lebih baik.

Ini yang paling menarik:
Yang dilatih bukanlah satu jawaban, melainkan serangkaian tindakan prediksi secara keseluruhan:
Apa yang dicari, apa yang dibaca, kapan berhenti, bagaimana menangani bukti yang bertentangan, dan akhirnya memberikan probabilitas berapa.

Diterapkan ke pasar prediksi, menurut saya langkah pertama bukanlah membuat AI melakukan trading otomatis.

Lebih baik dulu menyimpannya sebagai buku harian ramalan:
1. Probabilitas saat itu
2. Bukti yang digunakan
3. Harga pasar
4. Apakah akan bertransaksi
5. Hasil selanjutnya
6. Klasifikasi penyebab kesalahan

Jika suatu sistem mengatakan 60%, dalam jangka panjang tidak seperti 60%, maka itu belum menjadi strategi, hanya bisa menulis alasan.

Jika Anda juga ingin berlatih "mencatat prediksi → menunggu hasil → mengkalibrasi diri sendiri", Anda bisa mulai dengan nominal kecil/simulasi, anggap saja sebagai buku harian prediksi, bukan saran trading.

Tautan yang saya gunakan sendiri:

Teks asli di sini:

Menurut saya yang paling layak dilihat bukanlah kesimpulannya sendiri, melainkan cara ia memecah "prediksi" menjadi proses yang dapat dilatih dan dievaluasi kembali.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan