使用 PHP 获取 DOM 元素

2022-08-30 22:15:22

我正在努力了解如何在PHP中使用DOMElement对象。我找到了这个代码,但我真的不确定它是否适用于我:

$dom = new DOMDocument();
$dom->loadHTML("index.php");

$div = $dom->getElementsByTagName('div');
foreach ($div->attributes as $attr) {
     $name = $attr->nodeName;
     $value = $attr->nodeValue;
     echo "Attribute '$name' :: '$value'<br />";
}

基本上,我需要的是搜索DOM中具有特定内容的,之后我需要提取一个非标准(即我用JS编写并放置的一个),以便我可以看到它的价值。原因是我需要一个片段和一个基于重定向的HTML片段。如果有人可以解释我如何使用DOMDocument来实现此目的,那将很有帮助。我真的很难理解发生了什么以及如何正确实现它,因为我显然做得不对。elementidattribute$_GET

编辑(我在哪里根据评论):

这是我的代码行4-26供参考:

<div id="column_profile">
    <?php
        require_once($_SERVER["DOCUMENT_ROOT"] . "/peripheral/profile.php");            
        $searchResults = isset($_GET["s"]) ? performSearch($_GET["s"]) : "";

        $dom = new DOMDocument();
        $dom->load("index.php");

        $divs = $dom->getElementsByTagName('div');
        foreach ($divs as $div) {
            foreach ($div->attributes as $attr) {
              $name = $attr->nodeName;
              $value = $attr->nodeValue;
              echo "Attribute '$name' :: '$value'<br />";
            }
        }
        $div = $dom->getElementById('currentLocation');
        $attr = $div->getAttribute('srckey');   
        echo "<h1>{$attr}</a>";
    ?>
</div>

<div id="column_main">

这是我收到的错误消息:

Warning: DOMDocument::load() [domdocument.load]: Extra content at the end of the document in ../public_html/index.php, line: 26 in ../public_html/index.php on line 10

Fatal error: Call to a member function getAttribute() on a non-object in ../public_html/index.php on line 21

答案 1

getElementsByTagName返回元素列表,因此首先需要遍历元素,然后遍历它们的属性。

$divs = $dom->getElementsByTagName('div');
foreach ($divs as $div) {
    foreach ($div->attributes as $attr) {
      $name = $attr->nodeName;
      $value = $attr->nodeValue;
      echo "Attribute '$name' :: '$value'<br />";
    }
}

在你的情况下,你说你需要一个特定的ID。这些应该是独一无二的,所以要做到这一点,你可以使用(注意getElementById可能不起作用,除非你先调用):$dom->validate()

$div = $dom->getElementById('divID');

然后获取您的属性:

$attr = $div->getAttribute('customAttr');

编辑:只是读取文件的内容,它不会执行它们。 不会以这种方式运行。您可能需要执行如下操作:$dom->loadHTMLindex.php

$dom->loadHTML(file_get_contents('http://localhost/index.php'))

答案 2

如果重定向来自外部服务器,您将无法访问 HTML。让我这样说:DOM在你试图解析它的时候并不存在。您可以做的是将文本传递给 DOM 解析器,然后以这种方式操作元素。或者更好的方法是将其添加为另一个GET变量。

编辑:您是否也知道客户端可以更改HTML并让它传递他们想要的任何内容?(使用像Firebug这样的工具)


推荐