Bence 1 saatlik ve üzeri barlarda ridge kullanmalısınız ama 1 dakikalık/5 dakikalık barlara geldiğinizde genellikle XGBoost'un kazandığını bulursunuz.
5 dakika biraz dikkatli ayarlama gerektiriyor ama 1 dakika ve özellikle saniyelerle XGBoost'un modelin daha iyi olmasından dolayı IC'nizde ekstra 0.01-0.025 ile hakim olduğunu görmeye başlıyorsunuz.
XGBoost gerçekten harika çünkü NaN değerlerini önleyebiliyorsunuz ( ki bu genellikle geri testler için bir sorun, yani geriye dönük veriler için farklı veri seti erişilebilirlikleri, bir sağlayıcı 10 yıla sahip olabilir, diğeri 2).
Elbette imputasyon yapabilirsiniz, ama bu en gerçekçi yöntem değil ve teknik olarak ileriye dönük bir bakış açısına sahiptir çünkü özelliğin ortalamasını/medyanını önceden açıklarsınız. Ayrıca, ileriye dönük bakış açısı içermeyen bir ortalama da kullanabilirsiniz, ama yine de...
Doğrusal şeyler için, uyum için 1 saatlik zaman dilimini ve daha yükseklerini karşılayamıyorsanız ve NaN'lerle uğraşmak istiyorsanız, en iyi seçeneğiniz IC ağırlıklı bir topluluk yapmak ve NaN'ler olduğunda ağırlıkları yeniden hesaplamaktır. ( Her bir özelliğin IC'sine ve hangi özelliklerin sette olduğuna sahip olduğunuzda, hangi ağırlığın ne olması gerektiğini anlamak tam olarak pahalı değildir. ).
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Tahminler üzerine notlar:
Bence 1 saatlik ve üzeri barlarda ridge kullanmalısınız ama 1 dakikalık/5 dakikalık barlara geldiğinizde genellikle XGBoost'un kazandığını bulursunuz.
5 dakika biraz dikkatli ayarlama gerektiriyor ama 1 dakika ve özellikle saniyelerle XGBoost'un modelin daha iyi olmasından dolayı IC'nizde ekstra 0.01-0.025 ile hakim olduğunu görmeye başlıyorsunuz.
XGBoost gerçekten harika çünkü NaN değerlerini önleyebiliyorsunuz ( ki bu genellikle geri testler için bir sorun, yani geriye dönük veriler için farklı veri seti erişilebilirlikleri, bir sağlayıcı 10 yıla sahip olabilir, diğeri 2).
Elbette imputasyon yapabilirsiniz, ama bu en gerçekçi yöntem değil ve teknik olarak ileriye dönük bir bakış açısına sahiptir çünkü özelliğin ortalamasını/medyanını önceden açıklarsınız. Ayrıca, ileriye dönük bakış açısı içermeyen bir ortalama da kullanabilirsiniz, ama yine de...
Doğrusal şeyler için, uyum için 1 saatlik zaman dilimini ve daha yükseklerini karşılayamıyorsanız ve NaN'lerle uğraşmak istiyorsanız, en iyi seçeneğiniz IC ağırlıklı bir topluluk yapmak ve NaN'ler olduğunda ağırlıkları yeniden hesaplamaktır. ( Her bir özelliğin IC'sine ve hangi özelliklerin sette olduğuna sahip olduğunuzda, hangi ağırlığın ne olması gerektiğini anlamak tam olarak pahalı değildir. ).