Я хотел поднять это, просто потому, что он сумасшедший. Может, у Уэса есть какая-то идея. Файл довольно регулярный: 1100 строк x ~ 3M столбцов, данные разделены на вкладку, состоящие исключительно из целых чисел 0, 1 и 2. Очевидно, этого не ожидается.
Если я предварительно заполняю фрейм данных, как показано ниже, он потребляет ~ 26 ГБ ОЗУ.
h = open("ms.txt")
header = h.readline().split("\t")
h.close()
rows=1100
df = pd.DataFrame(columns=header, index=range(rows), dtype=int)
Информация о системе:
- python 2.7.9
- ipython 2.3.1
- numpy 1.9.1
- pandas 0.15.2.
Любые идеи приветствуются.