PHP DOM nodeValue не работает

Question

PHP DOM nodeValue не работает

0

Я пытаюсь разобрать HTML-таблицу с DOM, и она отлично работает, но когда какая-то ячейка содержит html, она работает неправильно.

Вот пример таблицы HTML

<tr>
<td>Razon Social: </td>
<td>Circulo Inmobiliaria Sur (Casa Central)</td>
</tr>

<tr>
<td>Email: </td>
<td> <img src="[email protected]"/> </td>
</tr>

И PHP Code:

$rows = $dom->getElementsByTagName('tr');

foreach ($rows as $row)   
{
    $cells = $row->getElementsByTagName('td');

    if(strpos($cells->item(0)->textContent, "Razon") > 0)
    {
        $_razonSocial = $cells->item(1)->textContent;
    }
    else if(strpos($cells->item(0)->textContent, "Email") > 0)
    {
        $_email = $cells->item(1)->textContent;
    }
}   

echo "Razon Social: $_razonSocial<br>Email: $_email";

ВЫВОД:

Razon Social: Circulo Inmobiliaria Sur (Casa Central) 
Email:

Электронная почта пуста, она должна быть:

<img src="[email protected]"/>

Я даже попробовал

$cells->item(1)->nodeValue;

вместо

$cells->item(1)->textContent;

Но это тоже не работает. Как я могу заставить его вернуть значение HTML?

Azeem 14 нояб. 2013, в 07:40

Источник

0

определить "не работает должным образом". Любая ошибка?
Raptor 14 нояб. 2013, в 06:12
0

Нет ошибки, ничего не возвращается. Просто пусто.
Azeem 14 нояб. 2013, в 06:15
0

Этот вар не пустой? $ _email ты уверен?
Evo SL 14 нояб. 2013, в 06:22
0

Есть идеи, Шиван? @Aveendra Это пусто.
Azeem 14 нояб. 2013, в 06:22
0

<img src="[email protected]"/> не является текстом. Это другая html-сущность. $cells->item(1)->item(0)->attr('src'); может быть
u_mulder 14 нояб. 2013, в 06:25
0

включено сообщение об ошибках / display_errors ?
Raptor 14 нояб. 2013, в 06:25
0

@u_mulder Это вызывает ошибку: вызов неопределенного метода DOMElement :: item () @ ShivanRaptor No.
Azeem 14 нояб. 2013, в 06:34

Показать ещё 5 комментариев

Теги:

php

html

dom

2 ответа

Ещё вопросы

определить "не работает должным образом". Любая ошибка?
Нет ошибки, ничего не возвращается. Просто пусто.
Этот вар не пустой? $ _email ты уверен?
<img src="[email protected]"/> не является текстом. Это другая html-сущность. $cells->item(1)->item(0)->attr('src'); может быть
включено сообщение об ошибках / display_errors ?
@u_mulder Это вызывает ошибку: вызов неопределенного метода DOMElement :: item () @ ShivanRaptor No.

u_mulder · Answer 1 · 2013-11-14T04-46-00.000Z

Как я уже упоминал, <img src="[email protected]"/> не является текстом. Это еще один html-объект. Поэтому попробуйте следующее:

if(strpos($cells->item(0)->textContent, "Razon") !== false) {
    $_razonSocial = $cells->item(1)->textContent;
} else if(strpos($cells->item(0)->textContent, "Email") !== false) {
    $count = 0;
    // here we get all child nodes of td.
    // space before img-tag is also a child node, but it has type DOMText
    // so we skip it.
    foreach ($cells->item(1)->childNodes as $child) {
        if (++$count == 2)
            $_email = $child->getAttribute('src');
    }
    // now in $_email you have full src value and can somehow extract email
}

anumavu · Answer 2 · 2013-11-14T04-38-00.000Z

Дать id вашей таблице как item_specification

 $dom = new DOMDocument();
        @$dom->loadHTML($html);
        $x = new DOMXPath($dom); 


    $table = $x->query("//*[@id='item_specification']/tr");
    $rows = $table;
    foreach ($rows as $row) {
     $atr_name = $row -> getElementsByTagName('td')->item(0)->nodeValue;
     $atr_val = $row -> getElementsByTagName('td')->item(1)->nodeValue;
     }

echo " {$atr_name} - {$atr_val} <br \>";

Его работа прекрасна.