jsoup не получает все изображения со страницы

0

Пытался извлечь изображения с этой страницы.

Используя приведенный ниже код, он извлекает только боковые изображения, такие как логотип и т.д., Но не получает изображение, в котором они отображают данные.

public static void main (String args[])
{   
    Document doc;
    try {       
        doc = Jsoup.connect("http://www.wolframalpha.com/input/?i=hepatitis").get();
        Elements desc =doc.select("img[src]");                               
        {
            for (Element link :desc)                
            System.out.println("text :"+link.absUrl("src"));
        }
    } catch (IOException e) {
        System.out.println(e);
    }  
}
}

Я даже пытался получить изображения, используя их идентификатор:

Elements desc =doc.select("#scannerresult_0300_1 img[src]");

но он не возвратил никакого результата.

  • 0
    Изображения, которые я пытаюсь получить, отсутствуют в представлении. Идентификатор источника, который я использовал, чтобы получить их, был получен с помощью элемента inspect jsoup. Не удается получить динамическое содержимое ??
  • 0
    если на ваш вопрос ответили, пожалуйста, примите ответ. Если вы найдете ответ очень полезным, вы также можете проголосовать за него.
Теги:
jsoup

1 ответ

0
Лучший ответ

На веб-сайте создается множество контента на основе javascripts. К сожалению, Jsoup не поддерживает их, поэтому скрипты не выполняются, поэтому контент не создается.

Дополнительную информацию см. В этом ответе: Получить содержимое (загруженное через вызов AJAX) веб-страницы

  • 0
    этот код извлекает часть изображения, хотя он вообще не должен делать это, поскольку все изображения поступают со стороны сервера, если ему удается получить пару изображений, то должен быть также какой-то способ извлечения всех изображений
  • 0
    Те изображения, которые вы видите, не генерируются из сценариев, они задаются с помощью соответствующих HTML-тегов (см. Исходный код сайта). Вы также можете проверить анализ документов jsoup, просто распечатайте doc и вы увидите, как jsoup «видит» веб-сайт. Другой способ: отключить все (или, по крайней мере, gojges ajax) javascripts, чтобы увидеть простой сайт. В качестве решения, вы можете попробовать htmlunit или что-то подобное (проверьте мою ссылку).
Показать ещё 1 комментарий

Ещё вопросы

Сообщество Overcoder
Наверх
Меню