URLConnection 不获取字符集

我用来从服务器下载一些东西。服务器说URL.openConnection()

Content-Type: text/plain; charset=utf-8

但返回.怎么回事?connection.getContentEncoding()null


答案 1

从 返回的值返回标头中的值URLConnection.getContentEncoding()Content-Encoding

代码来自URLConnection.getContentEncoding()

/**
     * Returns the value of the <code>content-encoding</code> header field.
     *
     * @return  the content encoding of the resource that the URL references,
     *          or <code>null</code> if not known.
     * @see     java.net.URLConnection#getHeaderField(java.lang.String)
     */
    public String getContentEncoding() {
       return getHeaderField("content-encoding");
    }

相反,而是执行 检索内容类型并从内容类型检索字符集。我已经包含了一个关于如何执行此操作的示例代码....connection.getContentType()

String contentType = connection.getContentType();
String[] values = contentType.split(";"); // values.length should be 2
String charset = "";

for (String value : values) {
    value = value.trim();

    if (value.toLowerCase().startsWith("charset=")) {
        charset = value.substring("charset=".length());
    }
}

if ("".equals(charset)) {
    charset = "UTF-8"; //Assumption
}

答案 2

这是记录的行为,因为该方法被指定为返回 HTTP 标头的内容,该内容未在示例中设置。您可以使用该方法并自行解析生成的字符串,或者可能使用更高级的HTTP客户端库,例如Apache中的HTTP客户端库。getContentEncoding()Content-EncodinggetContentType()


推荐