кто-нибудь знает, можно ли восстановить пропущенные значения в данных с помощью какой-либо модель, если отсутствует целевой признак?
в дополнение к уже сказаному: если пропусков больше 50% в колонке удаляют всю колонку, если меньше 5% в колонке- строки удаляют, если данные числовые - вставляют среднее, если числовые в timeseries - среднее за предыдущий период, если категориальные - можно вставить наиболее часто встречающуюся категорию, если много категорий суммарное кол во, которых меньше 5% от остальных, все эти категории можно обьединить в отдельную категорию: "другие".