Классификаторы пакетов машинного обучения, такие как liblinear и nltk, предлагают метод show_most_informative_features()
, который действительно полезен для функций отладки:
viagra = None ok : spam = 4.5 : 1.0
hello = True ok : spam = 4.5 : 1.0
hello = None spam : ok = 3.3 : 1.0
viagra = True spam : ok = 3.3 : 1.0
casino = True spam : ok = 2.0 : 1.0
casino = None ok : spam = 1.5 : 1.0
Мой вопрос: если что-то подобное реализовано для классификаторов в scikit-learn. Я искал документацию, но не мог найти ничего подобного.
Если такой функции еще нет, кто-нибудь знает обходное решение, как добраться до этих значений?
Спасибо, много!