AL
Есть набор объектов с атрибутами, среди атрибутов есть атрибут-множество.
Если сравнивать "похожесть" двух объектов, то в случае когда все атрибуты (кроме атрибута-множества) равны, атрибуты-множество сравниваются так что должно быть минимально-необходимое количество общих элементов (>= 1 например).
И вот не понятно, с одной стороны, можно было бы задать меру расстояний и применить кластеризацию, но как быть атрибутом-множеством - не очень пока ясно.
Может кто-то толкнет к нужном направлении.