Отказ от HTML с PHP и проблемы с кодированием

1

Я пытаюсь отменить следующий URL-адрес с помощью PHP: http://www.clubedoricardo.com.br/Produto/Smartphone-Samsung-Galaxy-Win-2-Duos-G360-Cinza-Dual-Chip-4G-Tela-45 -Камера-5MP-Лобовой-2MP-Quad-Core-12GHz-8GB/44-491-496-568187

$url="http://www.clubedoricardo.com.br/Produto/Smartphone-Samsung-Galaxy-Win-2-Duos-G360-Cinza-Dual-Chip-4G-Tela-45-Camera-5MP-Frontal-2MP-Quad-Core-12Ghz-8GB/44-491-496-568187";
$dom = new DOMDocument;
$dom->loadHTMLFile($url);
$page_content = $dom->saveHTML();
echo($page_content);

Но в тексте есть странные персонажи. Я пробовал кодирование с UTF-8 и ISO-8859, но ничего не меняется.

Есть идеи?

Теги:
web-scraping
encoding

1 ответ

0

Когда я следую приведенной ссылке, появится пустой веб-сайт. Пытаться:

$dom->loadHTML(mb_convert_encoding($url, 'HTML-ENTITIES', 'UTF-8'));
  • 0
    Извините, я исправил URL сейчас. Должен ли я попробовать "loadHTML" или "loadHTMLFile"?

Ещё вопросы

Сообщество Overcoder
Наверх
Меню