Тайм-аут file_get_contents для конкретного сайта?

0

До недавнего времени у меня был автоматический запуск сценария, который идет против Gamestop.com, чтобы собирать названия игр/цены и т.д.

На прошлой неделе, однако, использование file_get_contents кажется тайм-аутом (оно идет намного дольше, чем необходимо, а затем возвращает false). Сначала я подумал, что они блокировали мой IP-адрес сервера, но, проверяя его на своей локальной машине, я получаю тот же результат.

Итак, мой вопрос: есть ли способ проверить, что на самом деле происходит, что вызывает функцию для возврата false? У меня есть подозрительное подозрение, что они могут блокировать запросы с заголовком, который появляется с файлом_get_contents, возможно ли это?

Если кто-то хочет также попробовать код локально для проверки работоспособности, вот очень простой тест:

<?php
     $test = file_get_contents("http://www.gamestop.com")
     echo $test;
?>

Заранее благодарю за любую помощь!

  • 1
    используйте библиотеку CUrl для получения данных вместо file_get_contents, тогда вы сможете отслеживать некоторые ошибки или эмулировать настоящий браузер
  • 0
    Кстати, опечатка. $test = file_get_contents("http://www.gamestop.com") отсутствует точка с запятой ;-)
Показать ещё 6 комментариев
Теги:
screen-scraping
file-get-contents
timeout

1 ответ

0
Лучший ответ

Это было фактически Gamestop, блокирующее скрипт пользовательским агентом по любой причине....

Решение заключалось в том, чтобы установить пользовательский агент в браузер, тогда все работает нормально.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню