Я использую DBSCAN для кластеризации некоторых данных с помощью Scikit-Learn (Python 2.7):
from sklearn.cluster import DBSCAN
dbscan = DBSCAN(random_state=0)
dbscan.fit(X)
Однако я обнаружил, что не было встроенной функции (кроме "fit_predict" ), которая могла бы назначать новые точки данных Y в кластеры, идентифицированные в исходных данных X. Метод K -средства имеет "предсказывать", но я хочу иметь возможность сделать то же самое с DBSCAN. Что-то вроде этого:
dbscan.predict(X, Y)
Чтобы плотность могла быть выведена из X, но возвращаемые значения (назначения/метки кластера) предназначены только для Y. Из того, что я могу сказать, эта возможность доступна в R, поэтому я предполагаю, что она также доступна на Python, Я просто не могу найти документацию для этого.
Кроме того, я попытался найти причины, по которым DBSCAN не может использоваться для маркировки новых данных, но я не нашел никаких оправданий.