У меня возникают проблемы с чтением из файла, обработкой его строки и сохранением в файле UTF-8.
Вот код:
try:
filehandle = open(filename,"r")
except:
print("Could not open file " + filename)
quit()
text = filehandle.read()
filehandle.close()
Затем я обрабатываю текст переменной.
И затем
try:
writer = open(output,"w")
except:
print("Could not open file " + output)
quit()
#data = text.decode("iso 8859-15")
#writer.write(data.encode("UTF-8"))
writer.write(text)
writer.close()
Это выводит файл отлично, но он делает это в iso 8859-15 в соответствии с моим редактором. Поскольку тот же редактор распознает входной файл (в имени файла переменной) как UTF-8, я не знаю, почему это произошло. Что касается моего повторного поиска, то прокомментированные строки должны решить проблему. Однако, когда я использую эти строки, результирующий файл имеет тарабарщину в специальном характере в основном, слова с тильдой, поскольку текст находится на испанском языке. Я бы очень признателен за любую помощь, поскольку я в тупике....