Я пытаюсь применить k-средство на множестве высокоразмерных точек данных (около 50 измерений) и задавался вопросом, есть ли какие-либо реализации, которые находят оптимальное количество кластеров.
Я помню, как где-то читал, что алгоритм обычно делает это так, что расстояние между кластерами максимизируется, а расстояние внутри кластера минимизировано, но я не помню, где я это видел. Было бы здорово, если бы кто-то мог указать мне на любые ресурсы, которые обсуждают это. Я использую SciPy для k-средств в настоящее время, но любая связанная библиотека также будет прекрасна.
Если есть альтернативные способы достижения того же или лучшего алгоритма, пожалуйста, дайте мне знать.