Может кто-нибудь объяснить мне, пожалуйста, как построить кривую ROC с ROCR. Я знаю, что я должен сначала запустить:
prediction(predictions, labels, label.ordering = NULL)
а затем:
performance(prediction.obj, measure, x.measure="cutoff", ...)
Я просто не понимаю, что имеется в виду с предсказанием и ярлыками. Я создал модель с ctree и cforest, и я хочу, чтобы кривая ROC для обоих из них сравнивала ее в конце. В моем случае атрибут класса - y_n, который, я полагаю, должен использоваться для ярлыков. Но как насчет прогнозов? Вот шаги, которые я делаю (dataset name= bank_part):
pred<-cforest(y_n~.,bank_part)
tablebank<-table(predict(pred),bank_part$y_n)
prediction(tablebank, bank_part$y_n)
После запуска последней строки я получаю эту ошибку:
Error in prediction(tablebank, bank_part$y_n) :
Number of cross-validation runs must be equal for predictions and labels.
Спасибо заранее!
Вот еще один пример: у меня есть учебный набор данных (bank_training) и тестовый набор данных (bank_testing), и я запускал randomForest, как показано ниже:
bankrf<-randomForest(y~., bank_training, mtry=4, ntree=2,
keep.forest=TRUE,importance=TRUE)
bankrf.pred<-predict(bankrf, bank_testing, type='response')
Теперь bankrf.pred является фактором-объектом с метками c = ( "0", "1" ). Тем не менее, я не знаю, как построить ROC, потому что я застрял в части предсказания. Вот что я делаю
library(ROCR)
pred<-prediction(bankrf.pred$y, bank_testing$c(0,1)
Но это все еще неверно, потому что я получаю сообщение об ошибке
Error in bankrf.pred$y_n : $ operator is invalid for atomic vectors