Всем привет! Есть тут люди которые разбираются в RFM тут такой вопрос есть RFM analize
quantiles = df_customer.quantile(q=[0.25,0.5,0.75])
# such that 1/4 score means best/worst customer feature
def scoring_four(x,p,d,invert):
""" the last argument in the API flips the order of the score,
such that LARGE score always means GOOD customer feature"""
if x <= d[p][0.25]:
return 1 if invert else 4
elif x <= d[p][0.50]:
return 2 if invert else 3
elif x <= d[p][0.75]:
return 3 if invert else 2
else:
return 4 if invert else 1
RFM table разделяешь на класттеры 111, 112, … , 444
Есть Kmeans разделение Передаешь сколько нужно кластеров какую нужно использовать(какой лучше, зачем нужно kmeans, rfm анализ и так тебе разделяет)?