Я создаю простую программу wordcount в Java, которая читает файлы в текстовом формате каталога.
Однако я продолжаю получать ошибку:
java.nio.charset.MalformedInputException: Input length = 1
из этой строки кода:
BufferedReader reader = Files.newBufferedReader(file,Charset.forName("UTF-8"));
Я знаю, что, вероятно, это получаю, потому что я использовал Charset
, который не включал некоторые символы в текстовые файлы, некоторые из которых включали символы других языков. Но я хочу включить эти символы.
Позже я узнал в JavaDocs, что Charset
является необязательным и используется только для более эффективного чтения файлов, поэтому я изменил код на:
BufferedReader reader = Files.newBufferedReader(file);
Но некоторые файлы по-прежнему бросают MalformedInputException
. Я не знаю, почему.
Мне было интересно, есть ли всеохватывающий Charset
, который позволит мне читать текстовые файлы со многими различными типами символов?
Спасибо.