Я пытаюсь изучить использование GBM с h2o
для проблемы классификации, чтобы заменить логистическую регрессию (GLM). Нелинейность и взаимодействие в моих данных заставляют меня думать, что GBM более подходит.
Я запустил базовый GBM (см. ниже) и сравнил AUC с AUC логистической регрессии. GBM работает намного лучше.
В классической линейной логистической регрессии можно было бы увидеть направление и влияние каждого из предикторов (x) на переменную результата (y).
Теперь я хотел бы оценить переменную важность оценки GBM таким же образом.
Как получить переменную важность для каждого из (двух) классов?
Я знаю, что переменная важность не совпадает с оценочным коэффициентом в логистической регрессии, но это поможет мне понять, какой предиктор влияет на класс.
Другие задали подобные вопросы, но предоставленные ответы не будут работать для объекта H2O.
Любая помощь очень ценится.
example.gbm <- h2o.gbm(
x = c("list of predictors"),
y = "binary response variable",
training_frame = data,
max_runtime_secs = 1800,
nfolds=5,
stopping_metric = "AUC")