Я пытаюсь получить весь текст URL-адреса с помощью Jsoup, это код:
Document doc = Jsoup.connect(Url).get();
System.out.println(doc.text());
Но проблема в том, что это не работает нормально для всех URL, которые я пробовал... Мне нужно получить весь текст с веб-страницы (разбор HTML), потому что я реализую прокси с помощью сокетов, и мне нужно подключиться к URL-адрес, затем найдите выбранное слово и, если оно существует, мне нужно заблокировать указанный URL-адрес, если он не существует, веб-страница возвращается в браузер.
Есть ли другой способ получить весь текст с веб-страницы?
Благодарю!
Если я правильно понял, вы хотите, чтобы весь текст с веб-страницы, правильно? Этот код должен получить все тексты с веб-страницы.
import org.jsoup.*;
import org.jsoup.nodes.*;
import org.jsoup.select.*;
public class Getdata {
public Getdata() {
try {
String url = "http://stackoverflow.com/questions/20597755/get-text-from-url";
Document doc = Jsoup.connect(url).get();
Elements element = doc.select("p");
for (Element t : element) {
System.out.println(t.text());
}
} catch (Exception ex) {
System.err.println(ex);
}
}
public static void main(String[] args) {
new Getdata();
}
}
Благодарю.
problem is that this is not working fine for all the URL's I tried...
как именно это не работает? Можете ли вы привести несколько примеров ввода, фактического и ожидаемого результата?