У меня есть каталог файлов, которые я пытаюсь проанализировать с помощью Python. У меня не было бы проблем, если бы они были одним и тем же расширением, но по какой-то причине они создавались с помощью последовательных числовых расширений после их первоначального расширения. Например: foo.log foo.log.1 foo.log.2 bar.log bar.log.1 bar.log.2 etc.
Кроме того, foo.log находится в формате XML, а bar.log - нет. Каков наилучший путь для чтения и анализа только файлов foo.log.*
и foo.log
? Файлы bar.log
не нужно читать. Ниже мой код:
import os
from lxml import etree
path = 'C:/foo/bar//'
listing = os.listdir(path)
for files in listing:
if files.endswith('.log'):
print files
data = open(os.path.join(path, files), 'rb').read()
tree = etree.fromstring(data)
search = tree.findall('.//QueueEntry')
Это не работает, так как он не читает никаких файлов .log.*
и дросселей парсера в файлах, которые читаются, но не в формате xml. Спасибо!