PHP DOMDocument - 获取 BODY 的 html 源代码
2022-08-30 22:04:11
我正在使用PHP的DOMDocument来解析和规范化用户提交的HTML,使用该方法来解析内容,然后通过以下方式获得格式良好的结果:loadHTML
saveHTML
$dom= new DOMDocument();
$dom->loadHTML('<div><p>Hello World');
$well_formed= $dom->saveHTML();
echo($well_formed);
这在解析片段和添加适当的结束标记方面做得很好。问题是我还得到了一堆我不想要的标签,例如,,和。我知道每个格式良好的HTML文档都需要这些标签,但是我正在规范化的HTML片段将入到现有的有效文档中。<!DOCTYPE>
<html>
<head>
<body>