Я пытаюсь очистить веб-сайт, чтобы изучить python и веб-соскабливание. В частности, я пытался очистить данные футбола на этой странице: https://www.whoscored.com/Regions/108/Tournaments/5/Seasons/7468/Stages/16548/PlayerStatistics/Italy-Serie-A-2018- 2019
Моя основная проблема заключается в том, как очистить все страницы основной таблицы данных, а не только первую. Я пытаюсь понять это с помощью селена и анализировать запросы, которые мой браузер отправляет, когда я нажимаю кнопку "Далее", но у меня возникают проблемы. Спасибо за внимание.
Используя вкладку сети браузера, нажав кнопку "Далее", вы можете проверить фактический запрос xhr (AJAX), который отправляется на сервер с каждым щелчком мыши. Запрос на этот URL:
https://www.whoscored.com/StatisticsFeed/1/GetPlayerStatistics?category=summary&subcategory=all&statsAccumulationType=0&isCurrent=true&playerId=&teamIds=&matchId=&stageId=16548&tournamentOptions=5&sortBy=Rating&sortAscending=&age=&ageComparisonType=&appearances=&appearancesComparisonType=&field=Overall&nationality=&positionOptions=&timeOfTheGameEnd=&timeOfTheGameStart=&isMinApp=true&page=2&includeZeroValues=&numberOfPlayersToPick=10
Обратите внимание на параметр строки "страница" - это увеличивается с каждым сделанным вами запросом. Кроме того, ответ на каждый запрос на самом деле очень удобен для разбора JSON, поэтому вы очень хороши.