Я хочу пропустить первые 17 строк при чтении текстового файла.
Скажем, файл выглядит так:
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
good stuff
Я просто хочу хороший материал. То, что я делаю, намного сложнее, но это та часть, с которой у меня проблемы.
Я хочу пропустить первые 17 строк при чтении текстового файла.
Скажем, файл выглядит так:
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
good stuff
Я просто хочу хороший материал. То, что я делаю, намного сложнее, но это та часть, с которой у меня проблемы.
Используйте срез, как показано ниже
with open('yourfile.txt') as f:
lines_after_17 = f.readlines()[17:]
Если файл слишком большой для загрузки в память:
with open('yourfile.txt') as f:
for _ in xrange(17):
next(f)
for line in f:
# do stuff
import itertools
with open('file.txt') as f:
for line in itertools.islice(f, 17, None): # start=17, stop=None
# process lines
Это решение помогло мне пропустить количество строк, заданных переменной linetostart
.
Вы получаете индекс (int) и строку (строку), если хотите их отслеживать.
В вашем случае вы заменяете linetostart на 18 или назначаете 18 переменной linetostart.
f = open("file.txt", 'r')
for i, line in enumerate(f, linetostart):
#Your code
for line in dropwhile(isBadLine, lines):
# process as you see fit
Полная демонстрация:
from itertools import *
def isBadLine(line):
return line=='0'
with open(...) as f:
for line in dropwhile(isBadLine, f):
# process as you see fit
Преимущества: Это легко расширяется в случаях, когда ваши префиксные линии сложнее, чем "0" (но не взаимозависимы).
Вы можете использовать List-Comprehension, чтобы сделать его однострочным:
[fl.readline() for i in xrange(17)]
Подробнее о представлении списка в PEP 202 и в Документация Python.
Вот способ получения строк между двумя номерами строк в файле:
import sys
def file_line(name,start=1,end=sys.maxint):
lc=0
with open(s) as f:
for line in f:
lc+=1
if lc>=start and lc<=end:
yield line
s='/usr/share/dict/words'
l1=list(file_line(s,235880))
l2=list(file_line(s,1,10))
print l1
print l2
Вывод:
['Zyrian\n', 'Zyryan\n', 'zythem\n', 'Zythia\n', 'zythum\n', 'Zyzomys\n', 'Zyzzogeton\n']
['A\n', 'a\n', 'aa\n', 'aal\n', 'aalii\n', 'aam\n', 'Aani\n', 'aardvark\n', 'aardwolf\n', 'Aaron\n']
Просто вызовите его одним параметром, чтобы перейти от строки n → EOF
Если это таблица.
pd.read_table("path/to/file", sep="\t", index_col=0, skiprows=17)