А подскажите, пожалуйста, если я временные ряды предсказываю обычными алгоритмами, например, бустингом, наверное, плохая идея оставлять 10 значный таймстэмп в качестве фичи? Если да, то что с ним можно делать?
Иногда можно временными рядами не пользоваться: сделать 10 фич, в которых хранится значение текущего месяца, 1 месяца назад, 2 месяцев и т.д. и закинуть в случайный лес. Фишка в том, что мы предскажем значение только в следующем месяце, когда ARIMA мог бы на несколько месяцев, если это вас устроит. Зато такой подход более интерпретируем для заказчика из-за того, что используем лес и можно на пальцах объяснить, как это работает
Тут больше вопросы в следующем:
- в генерации фич из дат (месяц, день, часы, конец или начало месяца, в этом дне есть праздник и т.п.)
- в формировании обучающей и тестовой выборок (к примеру, в тестовую выборку положить самые поздние события)