Я вважаю, що для барів 1 години та більше слід використовувати ridge, але коли ви переходите до барів 1 хвилини/5 хвилин, зазвичай виграє XGBoost.
5 хвилин потребує деякої обережної налаштування, але 1 хвилина, і особливо секунди, ви починаєте бачити, як XGBoost домінує на додаткові 0.01-0.025 на вашому IC, будучи просто кращою моделлю.
XGBoost досить класний, тому що ви можете уникнути значень NaN (, що часто є проблемою для ретро-тестування, тобто різна доступність наборів даних для оглядів, один постачальник може мати 10 років, інший 2).
Звичайно, ви можете імпутувати, але це не найреалістичніший спосіб робити речі і технічно має попередній перегляд, оскільки ви розкриваєте середнє/медіану ознаки заздалегідь. Ви також можете використовувати середнє без попереднього перегляду, але все ще...
Для лінійних даних, де ви не можете дозволити собі налаштування в 1 годину та більше, І де ви хочете працювати з NaNs, найкраще рішення - це зробити зважене об'єднання IC і перерахувати ваги щоразу, коли з'являються NaNs ( не так вже й складно зрозуміти, яка вага має бути, коли у вас є IC кожної ознаки та які ознаки входять у набір ).
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Примітки щодо прогнозування:
Я вважаю, що для барів 1 години та більше слід використовувати ridge, але коли ви переходите до барів 1 хвилини/5 хвилин, зазвичай виграє XGBoost.
5 хвилин потребує деякої обережної налаштування, але 1 хвилина, і особливо секунди, ви починаєте бачити, як XGBoost домінує на додаткові 0.01-0.025 на вашому IC, будучи просто кращою моделлю.
XGBoost досить класний, тому що ви можете уникнути значень NaN (, що часто є проблемою для ретро-тестування, тобто різна доступність наборів даних для оглядів, один постачальник може мати 10 років, інший 2).
Звичайно, ви можете імпутувати, але це не найреалістичніший спосіб робити речі і технічно має попередній перегляд, оскільки ви розкриваєте середнє/медіану ознаки заздалегідь. Ви також можете використовувати середнє без попереднього перегляду, але все ще...
Для лінійних даних, де ви не можете дозволити собі налаштування в 1 годину та більше, І де ви хочете працювати з NaNs, найкраще рішення - це зробити зважене об'єднання IC і перерахувати ваги щоразу, коли з'являються NaNs ( не так вже й складно зрозуміти, яка вага має бути, коли у вас є IC кожної ознаки та які ознаки входять у набір ).