Я думаю, что для баров 1 час и выше следует использовать ridge, но когда вы переходите к барам 1 минута/5 минут, обычно XGBoost побеждает.
5 минут требует немного тщательной настройки, но через 1 минуту, особенно секунды, вы начинаете видеть, как XGBoost доминирует на дополнительные 0.01-0.025 по вашему IC, просто будучи лучшей моделью.
XGBoost довольно крут, потому что вы можете избежать значений NaN (, что часто является проблемой для бэктестов, т.е. разные доступности наборов данных для ретроспектив, один провайдер может иметь 10 лет, другой 2).
Вы, конечно, можете импутировать, но это не самый реалистичный способ делать вещи и технически имеет предвосхищение, поскольку вы раскрываете среднее/медиану признака заранее. Вы также можете использовать свободное от предвосхищения среднее, но всё равно...
Для линейных вещей, где вы не можете позволить себе временной интервал 1 час и выше, И где вы хотите иметь дело с NaN, лучшим вариантом будет сделать взвешенный ансамбль IC и пересчитывать веса всякий раз, когда есть NaN (, не так уж и дорого выяснить, какой вес должен быть каким, когда у вас есть IC каждой функции и какие функции находятся в наборе ).
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Заметки по прогнозированию:
Я думаю, что для баров 1 час и выше следует использовать ridge, но когда вы переходите к барам 1 минута/5 минут, обычно XGBoost побеждает.
5 минут требует немного тщательной настройки, но через 1 минуту, особенно секунды, вы начинаете видеть, как XGBoost доминирует на дополнительные 0.01-0.025 по вашему IC, просто будучи лучшей моделью.
XGBoost довольно крут, потому что вы можете избежать значений NaN (, что часто является проблемой для бэктестов, т.е. разные доступности наборов данных для ретроспектив, один провайдер может иметь 10 лет, другой 2).
Вы, конечно, можете импутировать, но это не самый реалистичный способ делать вещи и технически имеет предвосхищение, поскольку вы раскрываете среднее/медиану признака заранее. Вы также можете использовать свободное от предвосхищения среднее, но всё равно...
Для линейных вещей, где вы не можете позволить себе временной интервал 1 час и выше, И где вы хотите иметь дело с NaN, лучшим вариантом будет сделать взвешенный ансамбль IC и пересчитывать веса всякий раз, когда есть NaN (, не так уж и дорого выяснить, какой вес должен быть каким, когда у вас есть IC каждой функции и какие функции находятся в наборе ).