Я просматриваю книгу "Python for Data Analysis" и испытываю проблемы в разделе базы данных "Пример: 2012 Федеральная избирательная комиссия", в которой данные считываются в DataFrame. Проблема в том, что один из столбцов данных всегда устанавливается как индексный столбец, даже если для параметра index_col установлено значение None.
Вот ссылка на данные: http://www.fec.gov/disclosurep/PDownload.do.
Вот код загрузки (чтобы сэкономить время при проверке, я устанавливаю nrows = 10):
import pandas as pd
fec = pd.read_csv('P00000001-ALL.csv',nrows=10,index_col=None)
Чтобы сохранить его, я исключаю вывод столбцов данных, но вот мой вывод (пожалуйста, не значения индекса):
In [20]: fec
Out[20]:
<class 'pandas.core.frame.DataFrame'>
Index: 10 entries, C00410118 to C00410118
Data columns:
...
dtypes: float64(4), int64(3), object(11)
И вот вывод книги (опять же с исключенными столбцами данных):
In [13]: fec = read_csv('P00000001-ALL.csv')
In [14]: fec
Out[14]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 1001731 entries, 0 to 1001730
...
dtypes: float64(1), int64(1), object(14)
Значения индекса в моем выводе фактически являются первым столбцом данных в файле, который затем перемещает все остальные данные слева на один. Кто-нибудь знает, как предотвратить этот столбец данных, который будет указан как индекс? Я хотел бы иметь индекс только +1, увеличивая целые числа.
Я новичок в python и pandas, поэтому извиняюсь за любые неудобства. Спасибо.