Я использую URL.openConnection()
для загрузки с сервера. Сервер говорит
Content-Type: text/plain; charset=utf-8
Но connection.getContentEncoding()
возвращает null
. Что?
Я использую URL.openConnection()
для загрузки с сервера. Сервер говорит
Content-Type: text/plain; charset=utf-8
Но connection.getContentEncoding()
возвращает null
. Что?
Это документированное поведение, поскольку метод getContentEncoding()
указан для возврата содержимого заголовка Content-Encoding
HTTP, который не указан в вашем примере. Вы можете использовать метод getContentType()
и проанализировать результирующую строку самостоятельно или, возможно, перейти на более расширенную клиентскую библиотеку HTTP, такую как Apache.
Значение, возвращаемое из URLConnection.getContentEncoding()
, возвращает значение из заголовка Content-Encoding
Код от URLConnection.getContentEncoding()
/**
* Returns the value of the <code>content-encoding</code> header field.
*
* @return the content encoding of the resource that the URL references,
* or <code>null</code> if not known.
* @see java.net.URLConnection#getHeaderField(java.lang.String)
*/
public String getContentEncoding() {
return getHeaderField("content-encoding");
}
Вместо этого скорее сделайте connection.getContentType()
, чтобы получить Content-Type и получить кодировку из Content-Type. Я включил пример кода о том, как это сделать....
String contentType = connection.getContentType();
String[] values = contentType.split(";"); // values.length should be 2
String charset = "";
for (String value : values) {
value = value.trim();
if (value.toLowerCase().startsWith("charset=")) {
charset = value.substring("charset=".length());
}
}
if ("".equals(charset)) {
charset = "UTF-8"; //Assumption
}
Как дополнение к ответу от @Buhake Sindi. Если вы используете Guava, вместо ручного разбора вы можете:
MediaType mediaType = MediaType.parse(httpConnection.getContentType());
Optional<Charset> typeCharset = mediaType.charset();