Господа, здравствуйте!
такой вопрос: у меня есть набор текстов, с неизвестной тематикой и неизвестным количеством кластеров.
Я решил применить иерархическую агломеративную кластеризацию. Построил локоть, посмотрел, построил дендограмму, сделал некие выводы насчет количества кластеров.
Так вот, проблема такова, что я не знаю, как правильно, а главное, автоматически, определять более или менее оптимальное количество кластеров?
Почитав, нашел метод (HDP) из R, но реализации в питоне не нашел.