Подтвердить что ты не робот

Можно ли читать категориальные столбцы с помощью pandas 'read_csv?

Я попытался передать параметр dtype с read_csv как dtype={n: pandas.Categorical}, но это не работает должным образом (результатом является объект). Руководство неясно.

4b9b3361

Ответ 1

В версии 0.19.0 вы можете использовать параметр dtype='category' в read_csv:

data = 'col1,col2,col3\na,b,1\na,b,2\nc,d,3'
df = pd.read_csv(StringIO(data), dtype='category')
print (df)

  col1 col2  col3
0    a    b     1
1    a    b     2
2    c    d     3

print (df.dtypes)
col1    category
col2    category
col3    category
dtype: object

Ответ 2

Категорирование не является допустимым dtype.

Этот fooobar.com/info/239909/... содержит сведения о том, как хранить категориальные данные в текстовом файле.