Чтобы не было проблемы с меньшим классом, надо пытаться oversampling сделать?)
А я правильно понял, что это так:
Найти k ближайших соседей каждого объекта меньшего класса, найти векторы от этого объекта до каждого соседа, и умножить кажлый вектор на число от 0 до 1
"To create a synthetic data point, take the vector between one of those k neighbors, and the current data point. Multiply this vector by a random number x which lies between 0, and 1."
html-теги и прочие вещи вроде я удалил