使用 Java 标准库将 HTML 字符转换回文本

2022-09-01 01:47:03

我想使用Java标准库将一些HTML字符转换回文本。我想知道是否有任何图书馆能达到我的目的?

/**
 * @param args the command line arguments
 */
public static void main(String[] args) {
    // TODO code application logic here

    // "Happy & Sad" in HTML form.
    String s = "Happy & Sad";
    System.out.println(s);

    try {
        // Change to "Happy & Sad". DOESN'T WORK!
        s = java.net.URLDecoder.decode(s, "UTF-8");
        System.out.println(s);
    } catch (UnsupportedEncodingException ex) {

    }
}

答案 1

我认为Apache Commons Lang库和方法就是你正在寻找的。请参阅 https://commons.apache.org/proper/commons-text/javadocs/api-release/org/apache/commons/text/StringEscapeUtils.htmlStringEscapeUtils.unescapeHtml3()unescapeHtml4()


答案 2

在这里,您只需在应用程序的lib jsoup中添加jar文件,然后使用此代码。

import org.jsoup.Jsoup;

public class Encoder {
    public static void main(String args[]) {
        String s = Jsoup.parse("<Français>").text();
        System.out.print(s);
    }
}

下载jsoup的链接:http://jsoup.org/download