Мне нужно создать фрейм данных, используя данные, хранящиеся в файле. Для этого я хочу использовать метод read_csv
. Однако разделитель не очень регулярный. Некоторые столбцы разделяются вкладками (\t
), другие разделяются пробелами. Более того, некоторые столбцы могут быть разделены на 2 или 3 или более пробелов или даже комбинацией пробелов и вкладок (например, 3 пробела, две вкладки и 1 пробел).
Есть ли способ сказать pandas правильно обрабатывать эти файлы?
Кстати, у меня нет этой проблемы, если я использую Python. Я использую:
for line in file(file_name):
fld = line.split()
И он работает отлично. Не имеет значения, есть ли между полями 2 или 3 пробела. Даже комбинации пробелов и вкладок не создают никаких проблем. Может ли pandas сделать то же самое?