TagSoup vs. Jsoup vs.HTML Parser vs. HotSax vs [ 已关闭]

2022-09-01 02:41:49

大量的HTML解析器可供选择(并坚持下去)令人难以置信:

http://java-source.net/open-source/html-parsers

如何选择最适合以下要求的产品:

  1. 成熟(比其他错误少)
  2. 活体和呼吸(即保持)
  3. 快速且资源高效(旨在在Android上运行)

根据您的经验,您会推荐哪种HTML解析器(以满足上述要求)以及为什么?


答案 1

好吧,我找到了答案,这是由@BalusC在另一个线程上给出

  1. 如果你只是想使用一个基于XML的工具来遍历它:JTidy
  2. 如果你想对HTML进行单元测试:HtmlUnit
  3. 如果你想从HTML中提取特定的数据:Jsoup

谢谢@BalusC。


答案 2

推荐