保留换行符 - 简单的 HTML DOM 解析器

php domparser

2022-08-30 16:50:11

当使用PHP Simple HTML DOM解析器时，换行符
标签被剥离是正常的吗？

答案 1

我知道这已经很旧了，但我也在寻找这个，并意识到实际上有一个内置的选项来关闭换行符的删除。无需编辑源代码。

PHP Simple HTML Dom Parser 的函数支持多个有用的参数：load

load($str, $lowercase=true, $stripRN=false, $defaultBRText=DEFAULT_BR_TEXT)

调用函数时，只需作为第三个参数传递即可。loadfalse

$html = new simple_html_dom();
$html->load("<html><head></head><body>stuff</body></html>", true, false);

如果使用，则为第九个参数。file_get_html

file_get_html($url, $use_include_path = false, $context=null, $offset = -1, $maxLen=-1, $lowercase = true, $forceTagsClosed=true, $target_charset = DEFAULT_TARGET_CHARSET, $stripRN=true, $defaultBRText=DEFAULT_BR_TEXT)

编辑：对于，它是第五个参数（感谢 yitwail）str_get_html

str_get_html($str, $lowercase=true, $forceTagsClosed=true, $target_charset = DEFAULT_TARGET_CHARSET, $stripRN=true, $defaultBRText=DEFAULT_BR_TEXT, $defaultSpanText=DEFAULT_SPAN_TEXT)

答案 2

我也在为此苦苦挣扎，因为我需要HTML在处理后易于编辑。

显然，脚本中有一个布尔值，设置为默认值。它剥离 HTML 中的或标记。SimpleHTMLDOM$stripRNtrue\r\n\r\n

将 var 设置为（脚本中多次出现..），您的问题就解决了。false