Ребят, если я нагенерил синтетические данные с помощью SMOTE (получил сбалансированный датасет) и потом после кросвалдиации 20 шт. усреднил метрики и получил recall =0.928 precision=0.93 f1 = 0.927887 , это нормально ? Мм, так можно делать или я в чём-то ошибаюсь ?
По-хорошему, нужно SMOTE делать внутри ресэмплов. То есть, мы делаем SMOTE на 9 частях, которые в данный момент являются трейном. И тестим на 10-й части без SMOTE. И так далее. Это заморочно, но более правильно.