如何删除html特殊字符?

2022-08-30 09:14:18

我正在为我的应用程序创建一个RSS源文件,其中我想删除HTML标记,这是由.但是没有删除HTML特殊代码字符:strip_tagsstrip_tags

  & © 

等。

请告诉我任何可以用来从我的字符串中删除这些特殊代码字符的函数。


答案 1

使用解码它们,或者使用以下命令删除它们:html_entity_decodepreg_replace

$Content = preg_replace("/&#?[a-z0-9]+;/i","",$Content); 

从这里)

编辑:根据雅克的评论替代

将“+”替换为{2,8}或其他东西可能会很好。这将限制在存在未编码的“&”时替换整个句子的机会。

$Content = preg_replace("/&#?[a-z0-9]{2,8};/i","",$Content); 

答案 2

使用html_entity_decode转换 HTML 实体。

您需要设置字符集才能使其正常工作。


推荐