和  

2022-09-01 20:07:49

任何人都可以解释我之间的区别吗?  and  

我有html数据以二进制形式存储在数据库中,空间可以是或有时。   

同样的问题是,当我使用JSoup lib将此HTML转换为纯文本时,它会正确转换它,但是如果我使用Java的String.contains(我的字符串)方法。看起来具有的HTML数据与具有的HTML数据不同。在两种情况下都找不到字符串,反之亦然。  

例:

HTML1 :This is my test string

HTML2 :This is my test string

如果我使用JSoup将其转换为纯文本。它返回

HTML 1 : 这是我的测试字符串

HTML 2 : 这是我的测试字符串

但两个字符串仍然不一样。为什么会这样?


答案 1

 是经典的空间,当你点击空格键时得到的那个,由他的HTML实体等效物表示。

 并表示不换行空格,通常用于防止浏览器将多个空格折叠在一起: 

"    "=>“”(仅折叠成一个空格)

"    "=>“ ”(未折叠)

如果要分析同时包含经典空格和不换行空格的字符串,则可以安全地将一个替换到另一个。


答案 2

 ,只是一个空格字符仅此而已。此字符的常规出现将在末尾折叠为一个空格字符。

其中 as 和都表示不间断的空格字符,并且如果它们一个接一个地连续出现,它们将被折叠或中断为一个空格字符。&#160 

唯一,它们之间的区别在于HTML编号并且是HTML名称&#160 

基本上所有这些都是HTML实体。您可以了解和了解它们,请参阅以下链接。

  1. 链接 1
  2. 链接 2