Я работаю с алгоритмом K-Means в R, и я хочу разобраться в различиях 4 алгоритмов Lloyd, Forgy, MacQueen и Hartigan-Wong, доступных для функции "kmeans" в пакете статистики.
Однако я был в состоянии получить достаточный ответ на этот вопрос.
Я нашел только редкую информацию: (Посетите http://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Clustering/K-Means)
Из этого описания Ллойд, Форджи и Хартиган-Вонг кажутся мне одинаковыми. Минимизация суммы квадратов или минимизация евклидова расстояния одинакова.
MacQueen отличается в том случае, если он обновляет два связанных кластера, если объект перемещается в другой кластер, если я прав.
Тем не менее, я до сих пор не вижу, в каких точках эти алгоритмы отличаются.