Проблемы с разбором фейсбука с помощью Jsoup

Question

Проблемы с разбором фейсбука с помощью Jsoup

1

Я написал программу для разбора facebook, и я могу получить все дерево DOM. Все идет хорошо, но когда я хочу выбрать все  -tags, проблема в том, что он возвращает массив нулевого размера. PS: Ничего не получается, когда я разбираю другие сайты, но facebook.

Вот мой код:

public static void main(String[] args) throws IOException {
    doc = connect(); //connect the website,
    System.out.print(doc.outerHtml());//in the wole html file, i can find the tag <p>
    newsHeadlines = doc.select("p"); //nothing
    doc.getElementsByTag("p");//nothing either
    oldEleStr = newsHeadlines.text();
    System.out.println(oldEleStr);//nothing
}


static Document connect() throws IOException {
    org.jsoup.Connection connection = Jsoup
            .connect("facebook.com")
            .cookies(
                    splitCookies(facebookCookies));
    Document doc = connection.get();
    return doc;
}

Zizy 17 янв. 2015, в 08:54

Источник

0

Можете ли вы вставить сюда HTML-код, который Jsoup не смог разобрать?
Stephan 19 янв. 2015, в 14:31
0

Какую версию JSoup вы используете? Он кричит «протокол не указан», когда есть только «facebook.com» (не « facebook.com» ). После изменения протокола все работает как положено
Maciej Dobrowolski 19 янв. 2015, в 15:15
0

Спасибо за ваш ответ, я решил проблему. Это потому, что все теги в области аннотаций (когда я их анализирую), ага, я не знаю почему. Вопрос в том, что когда я просматриваю исходный код Facebook в моем браузере, теги не в аннотации.
Zizy 20 янв. 2015, в 15:43

Показать ещё 1 комментарий

Теги:

java

jsoup

facebook

1 ответ

Ещё вопросы

Можете ли вы вставить сюда HTML-код, который Jsoup не смог разобрать?
Какую версию JSoup вы используете? Он кричит «протокол не указан», когда есть только «facebook.com» (не « facebook.com» ). После изменения протокола все работает как положено
Спасибо за ваш ответ, я решил проблему. Это потому, что все теги в области аннотаций (когда я их анализирую), ага, я не знаю почему. Вопрос в том, что когда я просматриваю исходный код Facebook в моем браузере, теги не в аннотации.

Abhi · Answer 1 · 2015-01-19T12-38-00.000Z

Вы можете попробовать что-то вроде:

Document new_doc = Jsoup.parse(doc.outerHtml());
Elements elements = doc.select("p");
for (Element aa : elements) {
    //TODO:
}