Marina Timakova
Добрый день, разбираюсь с третьей неделей курса "Обучение на размеченных данных". Там в практическом задании есть пункт, где нужно сбалансировать выборку, используя np.random.seed(0)
indices_to_add = np.random.randint(...)
X_train_to_add = X_train[y_train.as_matrix() == 1,:][indices_to_add,:]. Я не совсем понимаю, что мы должны получить на выходе и как должен сработать код.
Добрый. np.random.seed(0) задает начальные условия генератора, indices_to_add = np.random.randint(...) - выдает набор случайных числен в тех границах и количестве, которые ему укажут, для нас это разность классов, X_train_to_add = X_train[y_train.as_matrix() == 1,:][indices_to_add,:] - формирует фрейм из признаковых описаний объектов 1 класса в объеме indices_to_add