Учитывая массив байтов, представляющих текст в некоей неизвестной кодировке (обычно UTF-8 или ISO-8859-1, но не обязательно), какой лучший способ получить предположение для наиболее вероятной кодировки (в Java )?
Стоит отметить:
- Дополнительные метаданные отсутствуют. Байт-массив - это единственный доступный вход.
- Алгоритм обнаружения, очевидно, не будет на 100% правильным. Если алгоритм верен более чем в 80% случаев, которые достаточно хороши.