Может ли кто-нибудь объяснить разницу между RandomForestClassifier и ExtraTreesClassifier в изучении scikit. Я потратил немало времени на чтение статьи:
Р. Geurts, D. Ernst., L. Wehenkel, "Чрезвычайно рандомизированные деревья", Machine Learning, 63 (1), 3-42, 2006
Кажется, что это разница для ET:
1) При выборе переменных при расщеплении выборки берутся из всего набора тренировок, а не из образца начальной загрузки обучающего набора.
2). Разбиения выбираются полностью случайным образом из диапазона значений в выборке на каждом расщеплении.
В результате этих двух вещей появилось гораздо больше "листьев".