Как я могу сохранить контент с другого сайта в моей базе данных?

0

Я хочу загрузить динамический контент с веб-сайта, основанного на футболе, в мою базу данных.

Я также хочу делать это ежедневно, с одной страницы на этом сайте (футбольные матчи за этот день).

Если вы можете мне помочь только при подключении и извлечении данных с этой веб-страницы, я буду управлять остальными.

веб-сайт: http://soccerstand.com/ язык: php/java - mysql

Спасибо!

Теги:

3 ответа

1
Лучший ответ

Вы можете использовать функцию php file для получения данных. Вы просто передаете ему URL-адрес, и он возвращает содержимое в виде массива строк из файла. Вы можете также использовать file_get_contents, чтобы получить содержимое как одну большую строку.

  • 0
    Ни один из них не обрабатывает перенаправления, задержки в сети или ошибки. Вы должны использовать curl при загрузке удаленного контента.
1

Используя curl, вы получите содержимое страницы, а затем с помощью regex вы получите то, что хотите.

Существует простой способ: http://www.jonasjohn.de/lab/htmlsql.htm

  • 0
    Использование синтаксического анализа DOM и / или simplexml, вероятно, будет проще, чем регулярное выражение, для анализа извлеченного содержимого.
1

Этические вопросы об очистке других данных сайта:

С помощью php вы можете делать "открытый" вызов на веб-сайте, если вы настроены по-разному. См. Эту страницу для получения дополнительной информации об этом и примерах: http://www.php.net/manual/en/wrappers.http.php

Оттуда у вас есть содержимое веб-страницы, и это вопрос разлома. В верхней части моей головы я использовал регулярные выражения или парсер HTML, чтобы разбить HTML-код, а затем прокрутить дочерние элементы и проанализировать данные в ваших вызовах базы данных для сохранения данных.

Есть много ресурсов для разбора HTML в Интернете, и это просто вопрос выбора того, который будет работать лучше всего для вас.

Имейте в виду, что вам нужно будет следить за сайтом за изменениями, потому что, если они меняют элементы или их классы/идентификаторы, вам может понадобиться также изменить структуру синтаксического анализа.

  • 0
    По крайней мере, в США оценки считаются фактами, которые защищены от претензий по авторскому праву. Ничто не мешает ему копировать ноты. Конечно IANYL применяется.
  • 0
    Согласен, я вижу, что на сайте тоже есть шансы, и это больше, где я видел возможные проблемы в будущем. Не графики.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню