هذه المقالة عن التنبؤ باستخدام التعلم المعزز (RL) مثيرة للاهتمام.


يمكن فهم ما تفعله على النحو التالي:
خذ مجموعة من أسئلة التنبؤ التاريخية التي تحتوي بالفعل على نتائج، ودع الذكاء الاصطناعي يعود إلى النقطة الزمنية في ذلك الوقت.
لكن لا يمكن السماح له بالوصول إلى الإنترنت اليوم مباشرة، وإلا سيرى الإجابات مسبقًا.
لذا أنشأ المؤلف بيئة "حاجب زمني":
يمكن للبحث فقط العثور على مواد من قبل ذلك الوقت؛
تُقرأ صفحات الويب عبر لقطات تاريخية؛
وتُعطى البيانات المالية واتجاهات السوق فقط الجزء المرئي في ذلك الوقت.
ثم دع النموذج يبحث عن المعلومات بنفسه، ويحكم على الأدلة، ويخرج الاحتمالات.
بعد الكشف عن النتائج الحقيقية، يتم تقييمه باستخدام قاعدة تسجيل مناسبة (proper scoring rule)، ثم يُستخدم التعلم المعزز لتعزيز عملية التنبؤ الأفضل.
أكثر ما يثير الاهتمام هنا:
لا يتم تدريب إجابة واحدة، بل مجموعة كاملة من إجراءات التنبؤ:
ما الذي تبحث عنه، وماذا تقرأ، ومتى تتوقف، وكيف تتعامل مع الأدلة المتضاربة، وأخيرًا ما الاحتمال الذي تعطيه.
في سوق التنبؤ، أعتقد أن الخطوة الأولى ليست جعل الذكاء الاصطناعي يتداول تلقائيًا.
بل يجب أولاً أن يحتفظ بـ "مذكرات التنبؤ":
1. الاحتمال في ذلك الوقت
2. الأدلة المستخدمة
3. سعر السوق
4. ما إذا كان سيتداول
5. النتيجة اللاحقة
6. تصنيف سبب الخطأ
إذا قال نظام ما إنه بنسبة 60%، ولكن على المدى الطويل لا تكون النتائج 60%، فهو ليس استراتيجية، بل مجرد كتابة مبررات.
إذا كنت ترغب أيضًا في ممارسة "تسجيل التنبؤ ← انتظار النتيجة ← معايرة نفسك"، يمكنك البدء بمبالغ صغيرة/محاكاة، واستخدامها كمذكرات تنبؤ، وليس كتوصيات تداول.
الرابط الذي أستخدمه:

النص الأصلي هنا:

أعتقد أن ما يستحق المشاهدة ليس الاستنتاج نفسه، بل كيفية تفكيك "التنبؤ" إلى عملية يمكن تدريبها ومراجعتها.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت