Jsoup вики скребок как мне получить оглавление

1

У меня возникли проблемы с соскабливанием оглавления на wiki. Я делаю простой веб-скребок для личного проекта, и я не могу понять, как очистить эти данные.

Вот моя попытка соскабливать оглавление с любой данной вики-страницы

 String contentOver = doc.select("#toclimit-3 > li").first().text();

ЗДЕСЬ КОД ИЗ СТРАНИЦЫ Я хочу очистить, как получить слово "Хронология"?:

    <ul> 
    <li class="toclevel-1 tocsection-1"><a href="#Chronology"><span class="tocnumber">1</span> <span class="toctext">Chronology</span></a></li>
Теги:
web-scraping
jsoup

1 ответ

1
Лучший ответ

Вы можете просто получить его по имени класса:

 Element li = doc.select("#toclimit-3 > li").first();
 String result = li.select(".toctext").first().text();
  • 0
    Я попробовал это, поэтому я получил исключение NUllpointer. Почему это?
  • 0
    @StreamingBits не могли бы вы попробовать именно этот doc.select(".toctext").first().text(); ?
Показать ещё 5 комментариев

Ещё вопросы

Сообщество Overcoder
Наверх
Меню