В sklearn GridSearchCV может взять конвейер в качестве параметра, чтобы найти лучшую оценку с помощью перекрестной проверки. Однако обычная перекрестная проверка такова:
чтобы перекрестно проверять данные временных рядов, данные обучения и тестирования часто разделяются следующим образом:
То есть, данные тестирования всегда должны быть впереди данных обучения.
Моя мысль:
-
Напишите мой собственный класс версии k-fold и передайте его в GridSearchCV, чтобы я мог наслаждаться удобством конвейера. Проблема состоит в том, что представляется трудно позволить GridSearchCV использовать указанные индексы обучения и тестирования данных.
-
Напишите новый класс GridSearchWalkForwardTest, который похож на GridSearchCV, я изучаю исходный код grid_search.py и считаю, что это немного сложно.
Любое предложение приветствуется.