Как извлечь идентификатор из div с определенным именем класса?
EX:
<div id="37849374" class="thread">
Foo foo foo foo
</div>
<div id="28393842" class="thread">
Doo doo doo doo
</div>
Я думаю о том, чтобы вернуться к регулярному выражению и просто продолжить это.
Сначала выберите все элементы с классом потоков:
doc.select("div.thread")
Затем используйте следующий метод для удаления атрибута id для каждого узла:
public Node removeAttr(String attributeKey)
API JSoup: http://jsoup.org/apidocs/
Elements.id()
будет работать.