Я хочу загрузить динамический контент с веб-сайта, основанного на футболе, в мою базу данных.
Я также хочу делать это ежедневно, с одной страницы на этом сайте (футбольные матчи за этот день).
Если вы можете мне помочь только при подключении и извлечении данных с этой веб-страницы, я буду управлять остальными.
веб-сайт: http://soccerstand.com/ язык: php/java - mysql
Спасибо!
Вы можете использовать функцию php file для получения данных. Вы просто передаете ему URL-адрес, и он возвращает содержимое в виде массива строк из файла. Вы можете также использовать file_get_contents, чтобы получить содержимое как одну большую строку.
Используя curl, вы получите содержимое страницы, а затем с помощью regex вы получите то, что хотите.
Существует простой способ: http://www.jonasjohn.de/lab/htmlsql.htm
Этические вопросы об очистке других данных сайта:
С помощью php вы можете делать "открытый" вызов на веб-сайте, если вы настроены по-разному. См. Эту страницу для получения дополнительной информации об этом и примерах: http://www.php.net/manual/en/wrappers.http.php
Оттуда у вас есть содержимое веб-страницы, и это вопрос разлома. В верхней части моей головы я использовал регулярные выражения или парсер HTML, чтобы разбить HTML-код, а затем прокрутить дочерние элементы и проанализировать данные в ваших вызовах базы данных для сохранения данных.
Есть много ресурсов для разбора HTML в Интернете, и это просто вопрос выбора того, который будет работать лучше всего для вас.
Имейте в виду, что вам нужно будет следить за сайтом за изменениями, потому что, если они меняют элементы или их классы/идентификаторы, вам может понадобиться также изменить структуру синтаксического анализа.