Я работаю над проблемой классификации с несбалансированными классами (5% 1). Я хочу предсказать класс, а не вероятность.
В двоичной задаче классификации по умолчанию используется scikit classifier.predict()
с помощью 0.5
?
Если это не так, то какой метод по умолчанию? Если это так, как мне его изменить?
В scikit некоторые классификаторы имеют параметр class_weight='auto'
, но не все делают. Если class_weight='auto'
, будет ли .predict()
использовать фактическую долю населения в качестве порога?
Какой способ сделать это в классификаторе типа MultinomialNB
, который не поддерживает class_weight
? Кроме использования predict_proba()
, а затем самостоятельно вычисляйте классы.