Предоставление входных данных для очистки веб-страниц

1

Я хочу отказаться от данных со следующего сайта:
http://www.upmandiparishad.in/commodityWiseAll.aspx

Есть два входных элемента: Commodity и Date. Как предоставить эти значения и получить полученную информацию?

  • 0
    не голосуйте никого
  • 0
    Люди опускают голос, потому что ваш вопрос был плохо сформирован, и он не требует никаких исследований. Я перефразировал это для вас. В будущем приложите реальные усилия в своих вопросах и исследованиях. Также проверьте мой ответ ниже для некоторых полезных советов.
Теги:
web-scraping

1 ответ

0

Чтобы извлечь данные с веб-страницы с Java, вы можете использовать jsoup.

Чтобы обеспечить входные элементы, вам нужно понять, как они предоставляются изначально вашим браузером. В принципе, существует два наиболее распространенных метода для запроса-ответа между клиентом и сервером:

  • GET - запрашивает данные из указанного ресурса
  • POST - отправка данных, подлежащих обработке, на указанный ресурс

Вы можете узнать больше о них здесь.

Когда вы выбираете входные значения Commodity и Date, вы можете исследовать методы, используемые для предоставления этих значений серверу, путем изучения сетевых запросов. Например, в Chrome вы можете нажать F12 и выбрать вкладку " Network ", чтобы проверить информацию, отправляемую в браузер и из него.

Когда вы узнаете способ предоставления данных, вы можете затем сформировать свой HTTP-запрос, чтобы предоставить одни и те же данные через jsoup или аналогичную библиотеку.
Например, вот как вы можете предоставить простые поля ввода для вашего запроса:

Document doc = Jsoup.connect("http://example.com/")
.data("some_input_1", "some_data_1")
.data("some_input_2", "some_data_2")
.post();

Это, конечно, только для того, чтобы вы начали, это отнюдь не полный ответ. Вам нужно показать реальные усилия на вашей стороне, чтобы искать ответы онлайн, так как их много.

Вот лишь некоторые из них, чтобы вы начали:

Ещё вопросы

Сообщество Overcoder
Наверх
Меню