По pca получается что первые две компоненты объясняют меньше 50 процентов дисперсии, поэтому решила не использовать
Взять 10 компонент. Как тут сказали, кластеризовать надо в пространстве > 2, например, PCA 10 компонент, там сделать кластеризацию. А вот проекцию уже umap\tsne на эти 10 компомент натянуть и отобразить в 2 ЧИСТО для визуализации