Добрый день. Есть у меня такая категория данных с названиями регионов. Проблема в том, что в ней огромное количество синонимичных значений, таких как "РЕСП. БАШКОРТОСТАН", "БАШКОРТОСТАН", "РЕСПУБЛИКА БАШКОРТОСТАН" и т.д. Можете посоветовать способ, как их можно было бы сгруппировать в более крупные?
Недавно по работе выполнял похожую задачу, нашёл модуль, который сравнивал два значения между собой и выдавал оценку схожести. Можно взять идеальный список регионов и сравнить с тем, что есть. Название модуля завтра скину, если не забуду