Я пытаюсь использовать пакет случайных лесов для классификации в R.
Переменные значения переменных перечислены ниже:
- означает значение необработанного значения переменной x для класса 0
- означает значение важного значения переменной x для класса 1
-
MeanDecreaseAccuracy
-
MeanDecreaseGini
Теперь я знаю, что они означают, так как я знаю их определения. Я хочу знать, как их использовать.
То, что я действительно хочу знать, это то, что означают эти значения только в контексте того, насколько они точны, что является хорошим значением, что плохое значение, каковы максимальные и минимальные значения и т.д.
Если переменная имеет высокий MeanDecreaseAccuracy
или MeanDecreaseGini
, значит, это важно или неважно? Также может быть полезна любая информация о сырых оценках.
Я хочу знать все, что нужно знать об этих числах, которые имеют отношение к их применению.
Объяснение, которое использует слова "ошибка", "суммирование" или "перестановка", было бы менее полезным, чем более простое объяснение, в котором не было бы никакого обсуждения того, как работают случайные леса.
Как если бы я хотел, чтобы кто-то объяснил мне, как использовать радио, я бы не ожидал, что объяснение связано с тем, как радио преобразует радиоволны в звук.