Есть ли встроенный способ использования read_csv
для чтения только первых строк n
файла, не зная длины строк раньше времени? У меня есть большой файл, который занимает много времени, чтобы читать, и изредка хочу использовать только первые, скажем, 20 строк, чтобы получить образец (и предпочитаем не загружать всю вещь и не брать ее в голову).
Если бы я знал общее количество строк, я мог бы сделать что-то вроде footer_lines = total_lines - n
и передать это ключевому слову skipfooter
. Мое текущее решение состоит в том, чтобы вручную захватить первые строки n
с помощью python и StringIO на pandas:
import pandas as pd
from StringIO import StringIO
n = 20
with open('big_file.csv', 'r') as f:
head = ''.join(f.readlines(n))
df = pd.read_csv(StringIO(head))
Это не так уж плохо, но есть ли более сжатый, "пандасический" (?) способ сделать это с помощью ключевых слов или чего-то еще?