Используя опубликованный код здесь, я создал хорошую иерархическую кластеризацию:
Скажем, что дендрограмма слева была создана, сделав что-то вроде
Y = sch.linkage(D, method='average') # D is a distance matrix
cutoff = 0.5*max(Y[:,2])
Z = sch.dendrogram(Y, orientation='right', color_threshold=cutoff)
Теперь как мне получить индексы членов каждого из цветных кластеров?. Чтобы упростить эту ситуацию, проигнорируйте кластеризацию сверху и сосредоточьтесь только на дендрограмме слева от матрица.
Эта информация должна храниться в хранимой переменной dendrogram Z
. Существует функция, которая должна выполнять только то, что я хочу назвать fcluster
(см. Документацию здесь). Однако я не вижу, где я могу дать fcluster тот же самый cutoff
, как я указал при создании дендрограммы. Похоже, что пороговая переменная в fcluster
, t
должна быть в виде различных неясных измерений (inconsistent
, distance
, maxclust
, monocrit
). Есть идеи?