保留换行符 - 简单的 HTML DOM 解析器

2022-08-30 16:50:11

当使用PHP Simple HTML DOM解析器时,换行符
标签被剥离是正常的吗?


答案 1

我知道这已经很旧了,但我也在寻找这个,并意识到实际上有一个内置的选项来关闭换行符的删除。无需编辑源代码。

PHP Simple HTML Dom Parser 的函数支持多个有用的参数:load

load($str, $lowercase=true, $stripRN=false, $defaultBRText=DEFAULT_BR_TEXT)

调用函数时,只需作为第三个参数传递即可。loadfalse

$html = new simple_html_dom();
$html->load("<html><head></head><body>stuff</body></html>", true, false);

如果使用 ,则为第九个参数。file_get_html

file_get_html($url, $use_include_path = false, $context=null, $offset = -1, $maxLen=-1, $lowercase = true, $forceTagsClosed=true, $target_charset = DEFAULT_TARGET_CHARSET, $stripRN=true, $defaultBRText=DEFAULT_BR_TEXT)

编辑:对于 ,它是第五个参数(感谢 yitwail)str_get_html

str_get_html($str, $lowercase=true, $forceTagsClosed=true, $target_charset = DEFAULT_TARGET_CHARSET, $stripRN=true, $defaultBRText=DEFAULT_BR_TEXT, $defaultSpanText=DEFAULT_SPAN_TEXT)

答案 2

我也在为此苦苦挣扎,因为我需要HTML在处理后易于编辑。

显然,脚本中有一个布尔值,设置为默认值。它剥离 HTML 中的 或 标记。SimpleHTMLDOM$stripRNtrue\r\n\r\n

将 var 设置为(脚本中多次出现..),您的问题就解决了。false


推荐