Может ли кто-нибудь указать мне на иерархический инструмент кластеризации (предпочтительнее в python), который может кластеризовать ~ 1 миллион объектов? Я пробовал hcluster
, а также Orange.
hcluster
имел проблемы с объектами 18k. Оранжевый смог скрыть 18 тыс. Объектов за считанные секунды, но не смог с 100 тыс. Объектов (насыщенная память и в конечном итоге разбилась).
Я работаю на 64-битном процессоре Xeon (2,53 ГГц) и 8 ГБ оперативной памяти + 3 ГБ на Ubuntu 11.10.