Как отфильтровать содержимое, захваченное file_get_contents?

0

Я получаю исходный код страницы в переменной $ html с этой строкой:

$html = file_get_contents('http://www.google.com');

И когда я делаю <textarea><?php echo htmlentities($html);?></textarea> <textarea><?php echo htmlentities($html);?></textarea>

Это работает потрясающе.

Предположим, я хочу вынуть каждый <h1> на странице с его содержимым в переменной $ h1, как это сделать из переменной $ html?

Теги:
file
file-get-contents

1 ответ

-1

Вы можете использовать Simple Html Dom Parser

Загрузите необходимый файл и попробуйте следующий код:

<?php

require_once ('simple_html_dom.php');
$html = file_get_contents('http://www.google.com');
$domHtml = str_get_html($html);
foreach ($domHtml->find('h1') as $element) {
    echo '<h1>' . $element->innertext . '</h1>';
}

Ещё вопросы

Сообщество Overcoder
Наверх
Меню