Как я могу сохранить контент с другого сайта в моей базе данных?

Question

Как я могу сохранить контент с другого сайта в моей базе данных?

0

Я хочу загрузить динамический контент с веб-сайта, основанного на футболе, в мою базу данных.

Я также хочу делать это ежедневно, с одной страницы на этом сайте (футбольные матчи за этот день).

Если вы можете мне помочь только при подключении и извлечении данных с этой веб-страницы, я буду управлять остальными.

веб-сайт: http://soccerstand.com/ язык: php/java - mysql

Спасибо!

Horatiu Jeflea 02 июнь 2010, в 01:15

Источник

Теги:

php

mysql

3 ответа

1

Используя curl, вы получите содержимое страницы, а затем с помощью regex вы получите то, что хотите.

Существует простой способ: http://www.jonasjohn.de/lab/htmlsql.htm

ilhan 01 июнь 2010, в 22:20

0

Использование синтаксического анализа DOM и / или simplexml, вероятно, будет проще, чем регулярное выражение, для анализа извлеченного содержимого.
Brent Baisley 02 июнь 2010, в 02:07

1

Этические вопросы об очистке других данных сайта:

С помощью php вы можете делать "открытый" вызов на веб-сайте, если вы настроены по-разному. См. Эту страницу для получения дополнительной информации об этом и примерах: http://www.php.net/manual/en/wrappers.http.php

Оттуда у вас есть содержимое веб-страницы, и это вопрос разлома. В верхней части моей головы я использовал регулярные выражения или парсер HTML, чтобы разбить HTML-код, а затем прокрутить дочерние элементы и проанализировать данные в ваших вызовах базы данных для сохранения данных.

Есть много ресурсов для разбора HTML в Интернете, и это просто вопрос выбора того, который будет работать лучше всего для вас.

Имейте в виду, что вам нужно будет следить за сайтом за изменениями, потому что, если они меняют элементы или их классы/идентификаторы, вам может понадобиться также изменить структуру синтаксического анализа.

Mike 01 июнь 2010, в 21:01

0

По крайней мере, в США оценки считаются фактами, которые защищены от претензий по авторскому праву. Ничто не мешает ему копировать ноты. Конечно IANYL применяется.
Daisetsu 01 июнь 2010, в 23:29
0

Согласен, я вижу, что на сайте тоже есть шансы, и это больше, где я видел возможные проблемы в будущем. Не графики.
Mike 01 июнь 2010, в 23:35

Ещё вопросы

Использование синтаксического анализа DOM и / или simplexml, вероятно, будет проще, чем регулярное выражение, для анализа извлеченного содержимого.
По крайней мере, в США оценки считаются фактами, которые защищены от претензий по авторскому праву. Ничто не мешает ему копировать ноты. Конечно IANYL применяется.
Согласен, я вижу, что на сайте тоже есть шансы, и это больше, где я видел возможные проблемы в будущем. Не графики.

echo · Accepted Answer · 2010-06-01T21-58-00.000Z

Вы можете использовать функцию php file для получения данных. Вы просто передаете ему URL-адрес, и он возвращает содержимое в виде массива строк из файла. Вы можете также использовать file_get_contents, чтобы получить содержимое как одну большую строку.

Ни один из них не обрабатывает перенаправления, задержки в сети или ошибки. Вы должны использовать curl при загрузке удаленного контента.