У меня проблемы с полным пониманием алгоритма K-Means ++. Меня интересует, как именно выбираются первые центроиды k
, а именно инициализация, как и остальные, как в оригинальном алгоритме K-средних.
- Используется ли функция вероятности на основе расстояния или гауссова?
- В то же время самая длинная дальняя точка (от других центроидов) выбрана для нового центроида.
Буду признателен пошаговое объяснение и пример. То, что в Википедии, недостаточно ясно. Также очень хорошо прокомментированный исходный код также поможет. Если вы используете 6 массивов, пожалуйста, сообщите нам, какой из них предназначен для чего.