Я получаю исходный код страницы в переменной $ html с этой строкой:
$html = file_get_contents('http://www.google.com');
И когда я делаю <textarea><?php echo htmlentities($html);?></textarea>
<textarea><?php echo htmlentities($html);?></textarea>
Это работает потрясающе.
Предположим, я хочу вынуть каждый <h1>
на странице с его содержимым в переменной $ h1, как это сделать из переменной $ html?
Вы можете использовать Simple Html Dom Parser
Загрузите необходимый файл и попробуйте следующий код:
<?php
require_once ('simple_html_dom.php');
$html = file_get_contents('http://www.google.com');
$domHtml = str_get_html($html);
foreach ($domHtml->find('h1') as $element) {
echo '<h1>' . $element->innertext . '</h1>';
}