如何在PHP中使用XMLReader?

2022-08-30 08:04:05

我有以下XML文件,该文件相当大,我无法让simplexml打开并读取文件,所以我正在尝试XMLReader,在php中没有成功

<?xml version="1.0" encoding="ISO-8859-1"?>
<products>
    <last_updated>2009-11-30 13:52:40</last_updated>
    <product>
        <element_1>foo</element_1>
        <element_2>foo</element_2>
        <element_3>foo</element_3>
        <element_4>foo</element_4>
    </product>
    <product>
        <element_1>bar</element_1>
        <element_2>bar</element_2>
        <element_3>bar</element_3>
        <element_4>bar</element_4>
    </product>
</products>

不幸的是,我还没有找到一个关于PHP的好教程,我很想看看我如何让每个元素内容存储在数据库中。


答案 1

这完全取决于工作单元的大小,但我想你正试图连续处理每个节点。<product/>

为此,最简单的方法是使用XMLReader访问每个节点,然后使用SimpleXML访问它们。通过这种方式,您可以保持较低的内存使用率,因为您一次处理一个节点,并且您仍然利用SimpleXML的易用性。例如:

$z = new XMLReader;
$z->open('data.xml');

$doc = new DOMDocument;

// move to the first <product /> node
while ($z->read() && $z->name !== 'product');

// now that we're at the right depth, hop to the next <product/> until the end of the tree
while ($z->name === 'product')
{
    // either one should work
    //$node = new SimpleXMLElement($z->readOuterXML());
    $node = simplexml_import_dom($doc->importNode($z->expand(), true));

    // now you can use $node without going insane about parsing
    var_dump($node->element_1);

    // go to next <product />
    $z->next('product');
}

快速概述不同方法的优缺点:

仅 XMLReader

  • 优点:速度快,占用内存少

  • 缺点:编写和调试起来太难了,需要大量的用户空间代码来做任何有用的事情。用户空间代码速度慢且容易出错。另外,它还为您提供了更多代码行需要维护

XMLReader + SimpleXML

  • 优点:不占用太多内存(只有处理一个节点所需的内存),顾名思义,SimpleXML非常易于使用。

  • 缺点:为每个节点创建一个 SimpleXMLElement 对象不是很快。你真的必须对它进行基准测试,以了解它是否对你来说是一个问题。不过,即使是一台适度的机器也能够每秒处理一千个节点。

XMLReader + DOM

  • 优点:使用的内存与SimpleXML一样多,XMLReader::expand()比创建新的SimpleXMLElement更快。我希望它可以使用,但在这种情况下似乎不起作用simplexml_import_dom()

  • 缺点:DOM使用起来很烦人。它位于XMLReader和SimpleXML之间。不像XMLReader那样复杂和尴尬,但距离使用SimpleXML还有光年的时间。

我的建议是:用SimpleXML写一个原型,看看它是否适合你。如果性能至关重要,请尝试 DOM。请尽量远离 XMLReader。请记住,编写的代码越多,引入 Bug 或引入性能回归的可能性就越大。


答案 2

对于使用属性格式化的 xml...

数据.xml:

<building_data>
<building address="some address" lat="28.902914" lng="-71.007235" />
<building address="some address" lat="48.892342" lng="-75.0423423" />
<building address="some address" lat="58.929753" lng="-79.1236987" />
</building_data>

代码:

$reader = new XMLReader();

if (!$reader->open("data.xml")) {
    die("Failed to open 'data.xml'");
}

while($reader->read()) {
  if ($reader->nodeType == XMLReader::ELEMENT && $reader->name == 'building') {
    $address = $reader->getAttribute('address');
    $latitude = $reader->getAttribute('lat');
    $longitude = $reader->getAttribute('lng');
}

$reader->close();

推荐