UNICODE 问题与 HTML 标题,问号?65533;
我正在尝试从以下网页解析标题:http://kid37.blogger.de/stories/1670573/
当我在title元素上使用apache.commons.lang StringEscapeUtils.escapeHTML方法时,我得到以下结果。
Das hermetische Caf�: Rock & Wrestling 2010
但是,当我在使用utf-8编码的网页中显示它时,它只显示一个问号。
使用以下代码:
String title = StringEscapeUtils.escapeHtml(myTitle);
如果我通过这个网站运行标题:http://tools.devshed.com/?option=com_mechtools&tool=27 我得到以下输出,这似乎是正确的
标题:
<title>Das hermetische Café: Rock & Wrestling 2010</title>
BECOMES(我期待escapeHtml方法这样做):
<title>Das hermetische Café: Rock & Wrestling 2010</title>
任何想法?谢谢