Лучший XML-парсер для PHP

120

Я раньше пользовался XML-парсером, и хотя он работал нормально, я был недоволен этим в целом, мне показалось, что я использовал обходные пути для вещей, которые должны быть базовой функциональностью.

Недавно я увидел SimpleXML, но я еще не пробовал. Это проще? Какие преимущества и недостатки имеют оба? Какие-либо другие парсеры, которые вы использовали?

  • 3
    Предложение для тех, кто читает это: задайте вопрос, описывающий, что вам нужно делать с XML (помимо простого анализа), и вы, вероятно, получите гораздо лучший ответ.
  • 2
    Пожалуйста, ознакомьтесь со следующим общим справочным вопросом по тегу PHP: Как анализировать и обрабатывать HTML / XML с помощью PHP?
Теги:
xml-parsing
parsing

6 ответов

95
Лучший ответ

Я бы сказал, что SimpleXML берет торт, потому что это, во-первых, расширение, написанное на C, и очень быстрое. Но во-вторых, анализируемый документ принимает форму объекта PHP. Таким образом, вы можете "запросить", как $root->myElement.

  • 12
    Simplexml является лучшим. Но не очень хорошо работать с пространствами имен, иногда бывает сложно
  • 2
    Да, я думаю, что это тоже лучше. И я использую с ним xpath. $ xml-> xpath ("// block"); // ЭТО СУПЕР :)
Показать ещё 6 комментариев
37

Посмотрите на PHP доступные расширения XML и см. http://devzone.zend.com/243/ и http://devzone.zend.com/1035/ для обсуждения этих вопросов.

Основное различие между XML Parser и SimpleXML заключается в том, что последний не является парсинговым анализатором. SimpleXML построен поверх расширений DOM и загружает весь XML файл в память. XML-анализатор, подобный XMLReader, будет загружать только текущий node в память. Вы определяете обработчики для определенных узлов, которые будут срабатывать при обнаружении Parser. Это быстрее и экономит память. Вы платите за это, не имея возможности использовать XPath.

Лично я нахожу SimpleXml довольно ограниченным (следовательно, простым) в том, что он предлагает по DOM. Вы можете легко переключаться между DOM и SimpleXml, но я обычно не беспокоюсь и напрямую направляюсь по маршруту DOM. DOM - это реализация DOM API W3C, поэтому вы можете быть знакомы с ним с других языков, например JavaScript.

  • 0
    так что вы используете в основном?
23

Это полезная функция для быстрого и легкого анализа XML, когда расширение недоступно:

<?php
/**
 * Convert XML to an Array
 *
 * @param string  $XML
 * @return array
 */
function XMLtoArray($XML)
{
    $xml_parser = xml_parser_create();
    xml_parse_into_struct($xml_parser, $XML, $vals);
    xml_parser_free($xml_parser);
    // wyznaczamy tablice z powtarzajacymi sie tagami na tym samym poziomie
    $_tmp='';
    foreach ($vals as $xml_elem) {
        $x_tag=$xml_elem['tag'];
        $x_level=$xml_elem['level'];
        $x_type=$xml_elem['type'];
        if ($x_level!=1 && $x_type == 'close') {
            if (isset($multi_key[$x_tag][$x_level]))
                $multi_key[$x_tag][$x_level]=1;
            else
                $multi_key[$x_tag][$x_level]=0;
        }
        if ($x_level!=1 && $x_type == 'complete') {
            if ($_tmp==$x_tag)
                $multi_key[$x_tag][$x_level]=1;
            $_tmp=$x_tag;
        }
    }
    // jedziemy po tablicy
    foreach ($vals as $xml_elem) {
        $x_tag=$xml_elem['tag'];
        $x_level=$xml_elem['level'];
        $x_type=$xml_elem['type'];
        if ($x_type == 'open')
            $level[$x_level] = $x_tag;
        $start_level = 1;
        $php_stmt = '$xml_array';
        if ($x_type=='close' && $x_level!=1)
            $multi_key[$x_tag][$x_level]++;
        while ($start_level < $x_level) {
            $php_stmt .= '[$level['.$start_level.']]';
            if (isset($multi_key[$level[$start_level]][$start_level]) && $multi_key[$level[$start_level]][$start_level])
                $php_stmt .= '['.($multi_key[$level[$start_level]][$start_level]-1).']';
            $start_level++;
        }
        $add='';
        if (isset($multi_key[$x_tag][$x_level]) && $multi_key[$x_tag][$x_level] && ($x_type=='open' || $x_type=='complete')) {
            if (!isset($multi_key2[$x_tag][$x_level]))
                $multi_key2[$x_tag][$x_level]=0;
            else
                $multi_key2[$x_tag][$x_level]++;
            $add='['.$multi_key2[$x_tag][$x_level].']';
        }
        if (isset($xml_elem['value']) && trim($xml_elem['value'])!='' && !array_key_exists('attributes', $xml_elem)) {
            if ($x_type == 'open')
                $php_stmt_main=$php_stmt.'[$x_type]'.$add.'[\'content\'] = $xml_elem[\'value\'];';
            else
                $php_stmt_main=$php_stmt.'[$x_tag]'.$add.' = $xml_elem[\'value\'];';
            eval($php_stmt_main);
        }
        if (array_key_exists('attributes', $xml_elem)) {
            if (isset($xml_elem['value'])) {
                $php_stmt_main=$php_stmt.'[$x_tag]'.$add.'[\'content\'] = $xml_elem[\'value\'];';
                eval($php_stmt_main);
            }
            foreach ($xml_elem['attributes'] as $key=>$value) {
                $php_stmt_att=$php_stmt.'[$x_tag]'.$add.'[$key] = $value;';
                eval($php_stmt_att);
            }
        }
    }
    return $xml_array;
}
?>
  • 1
    работал как шарм, где simpleXml не удалось в нескольких скриптах, над которыми я работаю, спасибо
  • 0
    Получение сообщения об ошибке: Примечание: неопределенная переменная: xml_array?
14

Привет, я думаю, что SimpleXml очень полезен. И с этим я использую xpath;

$xml = simplexml_load_file("som_xml.xml");

$blocks  = $xml->xpath('//block'); //gets all <block/> tags
$blocks2 = $xml->xpath('//layout/block'); //gets all <block/> which parent are   <layout/>  tags

Я использую много конфигураций xml, и это помогает мне очень быстро их анализировать. SimpleXml записывается на C, поэтому он очень быстрый.

11

Это зависит от того, что вы пытаетесь сделать с файлами XML. Если вы просто пытаетесь прочитать XML файл (например, файл конфигурации), The Wicked Flea корректно предлагает SimpleXML, поскольку он создает то, что составляет вложенные ArrayObjects. например значение будет доступно $xml- > root- > child.

Если вы хотите манипулировать XML файлами, вам, вероятно, лучше всего использовать DOM XML

0

синтаксический анализатор crxml - это простой анализатор.

Этот класс имеет функцию поиска, которая принимает имя node с любым пространством имен в качестве аргумента. Он ищет xml для node и распечатывает оператор доступа для доступа к этому node с помощью этого класса. Этот класс также упрощает создание xml.

вы можете загрузить этот класс в

http://freshmeat.net/projects/crxml

или с сайта phpclasses.org

http://www.phpclasses.org/package/6769-PHP-Manipulate-XML-documents-as-array.html

  • 11
    Вы, вероятно, захотите раскрыть, что вы являетесь автором этого класса.
  • 0
    PHPClasses.org все еще вещь? Редактировать: О, я думаю, это было еще в 11 году

Ещё вопросы

Сообщество Overcoder
Наверх
Меню