Хранение HTML-страницы в строке

0

У меня есть URL, из которого мне нужен его HTML. Я использовал следующий фрагмент кода.

String url = "http://www.sears.com/search="+keywords;
String jsp = retrieveContent(url);

Я заметил, что строка jsp имеет другое содержимое, чем фактический исходный код веб-страницы (когда я просматриваю исходный код из моего браузера). Я считаю, что сценарий на стороне сервера (или он перенаправляется) вызывается, когда браузер открывается, и этот вывод скрипта - это то, что я вижу. Можете ли вы рассказать мне, как получить фактический html файл страницы?

Вы можете проверить эту ссылку в качестве примера. как я могу получить фактический html этого pagE?

http://www.sears.com/search=baby%20strollers

Теги:

3 ответа

0

Существует множество библиотек для раскрутки содержимого html, которые будут делать трюк, тот, который я использовал, JSOUP, JSOUP говорит:

"очистить и проанализировать HTML из URL, файла или строки"

JSOUP может удовлетворить вашу цель.

  • 0
    Jsoup - это то, что я использую, но мне нужно получить HTML для его анализа. Прямо сейчас, я не получаю правильный исходный код вообще, я получаю другой исходный код, когда я использую прямой метод для получения HTML-источника URL.
0

я хотел бы увидеть код метода retrieveContent, если это возможно, и если вы пытаетесь напрямую прочитать html-контент url, тогда есть хороший пример здесь http://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html

  • 0
    Я сделал почти так же, как указано в примере, но HTML, который я получаю, не совпадает с исходным кодом, который я получаю в браузере.
0

Страница HTML хранится в переменной jsp. alert (jsp) покажет вам страницу.

  • 0
    Undefined local method or variable 'alert' ;)
  • 1
    Так что это не javascript. оповещение показывает во всплывающем окне, что находится в переменной.
Показать ещё 1 комментарий

Ещё вопросы

Сообщество Overcoder
Наверх
Меню