Программный доступ к веб-странице

0

Существует веб-сайт, на котором отображаются результаты после ввода номера рулона и нажатия кнопки отправки. Мне нужно программно получить доступ к результатам некоторых доступных номеров рулонов.

Код HTML для пены:

<form action="http://www.rtuportal.com/result/65-b-tech-ivth-sem-main-exam-result-2013/" method="post">
    <input type="" name="roll_number" value="" placeholder="enter your roll number">
    <input type="submit" value="Submit">
</form><div style="margin-top: 30px;"><div class="fb-comments" data-href="http://www.rtuportal.com/result/65-b-tech-ivth-sem-main-exam-result-2013/" data-width="730" data-num-posts="10"></div></div>
  1. Является ли число рулона для отправки в URL, указанной в action атрибута form тега?
  2. Какие данные необходимо отправить и как их отформатировать?

Я буду делать это на Java с помощью jsoup.

ОБНОВЛЕНИЕ: я могу получить URL-адрес, где имеются данные результата, но когда я подключаюсь к нему с помощью jsoup, я получаю "ошибку", но когда я посещаю один и тот же URL-адрес через браузер, результат отображается правильно. Нужно ли мне что-то сделать, чтобы этот запрос jsoup выглядел как запрос браузера? Я уже использую Mozilla как UA.

Теги:
parsing

1 ответ

1
  1. да
  2. Форма использует метод post. Взгляните на этот код. Он открывает страницу результатов как Mozilla Firefox. Переменная с именем, определенным в <input type="" name="roll_number", передается на страницу с помощью метода data().

Форматирование кода не работает правильно

Document doc = Jsoup.connect("url")
.data("roll_number", "yourValue")
.userAgent("Mozilla")
.post();
  • 0
    Это не сработало. HTML-код получателя не содержит никаких результатов. Если я сохраню код в виде HTML-файла и отключу Интернет, браузер просто отобразит сообщение об ошибке «Сервер не найден» в строке результата. Страница по-прежнему получает данные результата с сервера после открытия полученной HTML-страницы.
  • 0
    ОБНОВЛЕНИЕ: из кода страницы результатов данные содержатся в iframe, который извлекает результат из URL и отправляет ключ вместе с номером ролла.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню