Sergey Salnikov
может, а может и нет, depends on. даже от используемого типа естиматора зависит, на одних это помогает, на других нет. для эксперимента - можно включить в это подможество значений те, у которых y = 1 (если это классификатор)
Абсолютно согласен, но добавить немного кросс-валидации лишним не будет. Но для бэйзлайна или предварительного отбора, в принципе, можно не заморачиваться и напрямую применить count к трейну, наверное...