jsoup не получает все изображения со страницы

Question

jsoup не получает все изображения со страницы

0

Пытался извлечь изображения с этой страницы.

Используя приведенный ниже код, он извлекает только боковые изображения, такие как логотип и т.д., Но не получает изображение, в котором они отображают данные.

public static void main (String args[])
{   
    Document doc;
    try {       
        doc = Jsoup.connect("http://www.wolframalpha.com/input/?i=hepatitis").get();
        Elements desc =doc.select("img[src]");                               
        {
            for (Element link :desc)                
            System.out.println("text :"+link.absUrl("src"));
        }
    } catch (IOException e) {
        System.out.println(e);
    }  
}
}

Я даже пытался получить изображения, используя их идентификатор:

Elements desc =doc.select("#scannerresult_0300_1 img[src]");

но он не возвратил никакого результата.

elijah 20 март 2014, в 19:54

Источник

0

Изображения, которые я пытаюсь получить, отсутствуют в представлении. Идентификатор источника, который я использовал, чтобы получить их, был получен с помощью элемента inspect jsoup. Не удается получить динамическое содержимое ??
elijah 20 март 2014, в 18:45
0

если на ваш вопрос ответили, пожалуйста, примите ответ. Если вы найдете ответ очень полезным, вы также можете проголосовать за него.
luksch 23 март 2014, в 16:48

Теги:

java

html

jsoup

1 ответ

Ещё вопросы

Изображения, которые я пытаюсь получить, отсутствуют в представлении. Идентификатор источника, который я использовал, чтобы получить их, был получен с помощью элемента inspect jsoup. Не удается получить динамическое содержимое ??
если на ваш вопрос ответили, пожалуйста, примите ответ. Если вы найдете ответ очень полезным, вы также можете проголосовать за него.

ollo · Accepted Answer · 2014-03-20T20-53-00.000Z

0

Лучший ответ

На веб-сайте создается множество контента на основе javascripts. К сожалению, Jsoup не поддерживает их, поэтому скрипты не выполняются, поэтому контент не создается.

Дополнительную информацию см. В этом ответе: Получить содержимое (загруженное через вызов AJAX) веб-страницы

ollo 20 март 2014, в 20:53

0

этот код извлекает часть изображения, хотя он вообще не должен делать это, поскольку все изображения поступают со стороны сервера, если ему удается получить пару изображений, то должен быть также какой-то способ извлечения всех изображений
elijah 21 март 2014, в 07:38
0

Те изображения, которые вы видите, не генерируются из сценариев, они задаются с помощью соответствующих HTML-тегов (см. Исходный код сайта). Вы также можете проверить анализ документов jsoup, просто распечатайте doc и вы увидите, как jsoup «видит» веб-сайт. Другой способ: отключить все (или, по крайней мере, gojges ajax) javascripts, чтобы увидеть простой сайт. В качестве решения, вы можете попробовать htmlunit или что-то подобное (проверьте мою ссылку).
ollo 21 март 2014, в 15:47
0

Я сейчас попробую модуль HTML. я видел источник просмотра этого сайта, ссылки на эти изображения не были там, их можно было увидеть только через элемент inspect, спасибо за помощь
elijah 21 март 2014, в 15:49

Показать ещё 1 комментарий