У меня есть данные pandas с некоторыми столбцами типа текста. Есть несколько значений NaN вместе с этими текстовыми столбцами. То, что я пытаюсь сделать, - это навязать эти NaN с помощью sklearn.preprocessing. Imputer (заменив NaN на наиболее частое значение). Проблема в реализации. Предположим, что существует pandas dataframe df с 30 столбцами, 10 из которых имеют категориальный характер. Когда я запустил
from sklearn.preprocessing import Imputer
imp = Imputer(missing_values='NaN', strategy='most_frequent', axis=0)
imp.fit(df)
Python генерирует ошибку: 'не удалось преобразовать строку в float:' run1 '', где 'run1' является обычным (не пропускаемым) значением из первого столбца с категориальными данными.
Любая помощь будет очень рада