Я пытаюсь преформировать рекурсивную функцию, используя scikit-learn
и случайный классификатор леса, с OOB ROC как метод подсчета каждого подмножества, созданного во время рекурсивного процесса.
Однако, когда я пытаюсь использовать метод RFECV
, я получаю сообщение об ошибке AttributeError: 'RandomForestClassifier' object has no attribute 'coef_'
Случайные леса не имеют коэффициентов как таковых, но они имеют рейтинг по показателю Джини. Итак, мне интересно, как решить эту проблему.
Обратите внимание, что я хочу использовать метод, в котором явным образом расскажу, какие функции из моего pandas
DataFrame были выбраны в оптимальной группировке, поскольку я использую рекурсивный выбор функции, чтобы попытаться свести к минимуму количество данных, которые я буду вводить в окончательный классификатор.
Вот пример кода:
from sklearn import datasets
import pandas as pd
from pandas import Series
from sklearn.ensemble import RandomForestClassifier
from sklearn.feature_selection import RFECV
iris = datasets.load_iris()
x=pd.DataFrame(iris.data, columns=['var1','var2','var3', 'var4'])
y=pd.Series(iris.target, name='target')
rf = RandomForestClassifier(n_estimators=500, min_samples_leaf=5, n_jobs=-1)
rfecv = RFECV(estimator=rf, step=1, cv=10, scoring='ROC', verbose=2)
selector=rfecv.fit(x, y)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/Users/bbalin/anaconda/lib/python2.7/site-packages/sklearn/feature_selection/rfe.py", line 336, in fit
ranking_ = rfe.fit(X_train, y_train).ranking_
File "/Users/bbalin/anaconda/lib/python2.7/site-packages/sklearn/feature_selection/rfe.py", line 148, in fit
if estimator.coef_.ndim > 1:
AttributeError: 'RandomForestClassifier' object has no attribute 'coef_'