Народ, привет. Пытаюсь составить pipeline для обработки данных, где в перемешку категориальные данные и числа. Хочу настроить на числа StandartScaler, но не могу разобраться, как в pipeline сделать так, чтобы скалер работал только с определёнными колонками
final_transformers_scaler = list()
# ct = ColumnTransformer([
# ('scaler', StandardScaler(), continuous_columns)
# ], remainder='passthrough')
# print(ct)
# final_transformers_scaler.append(ct)
for cat_col in categorical_columns:
cat_transformer = Pipeline([
('selector', FeatureSelector(column=cat_col)),
('ohe', OHEEncoder(key=cat_col))
])
print(cat_col, cat_transformer)
final_transformers_scaler.append((cat_col, cat_transformer))
for cont_col in continuous_columns:
cont_transformer = Pipeline([
('selector', NumberSelector(key=cont_col)),
('scaler', StandartScaler())
])
final_transformers_scaler.append((cont_col, cont_transformer))
В таком виде он пытается обработать все. Кто-нибудь сталкивался?