Если в датасете тренировочных данных 10% от выборки ( 80 тренировочных , а предсказать надо на 800), то что лучше рандомного леса можно попробовать ?
Параметра всего 2 , данных мало
Случайный лес на 80 примерах — это в целом очень плохая идея.
Пробовать надо что-то простое: линейные модели, свм, например
Если задача классификации, то ещё наивный байес, LDA, QDA