Получить текст с URL

0

Я пытаюсь получить весь текст URL-адреса с помощью Jsoup, это код:

Document doc = Jsoup.connect(Url).get();
System.out.println(doc.text());

Но проблема в том, что это не работает нормально для всех URL, которые я пробовал... Мне нужно получить весь текст с веб-страницы (разбор HTML), потому что я реализую прокси с помощью сокетов, и мне нужно подключиться к URL-адрес, затем найдите выбранное слово и, если оно существует, мне нужно заблокировать указанный URL-адрес, если он не существует, веб-страница возвращается в браузер.

Есть ли другой способ получить весь текст с веб-страницы?

Благодарю!

  • 1
    problem is that this is not working fine for all the URL's I tried... как именно это не работает? Можете ли вы привести несколько примеров ввода, фактического и ожидаемого результата?
  • 1
    как насчет того, чтобы вообще не использовать Jsoup и попробовать что-то вроде этого: URL url = новый URL (args [0]); Scanner scan = новый сканер (url.openStream ()); while (scan.hasNextLine ()) // используем api документа для вставки в него строк}
Теги:
jsoup
proxy

1 ответ

0

Если я правильно понял, вы хотите, чтобы весь текст с веб-страницы, правильно? Этот код должен получить все тексты с веб-страницы.

  import org.jsoup.*;
  import org.jsoup.nodes.*;
  import org.jsoup.select.*;

  public class Getdata {
    public Getdata() {
      try {
           String url = "http://stackoverflow.com/questions/20597755/get-text-from-url";
           Document doc = Jsoup.connect(url).get();
           Elements element = doc.select("p");

           for (Element t : element) {
             System.out.println(t.text());
           }

         } catch (Exception ex) {
           System.err.println(ex);

      }
}

public static void main(String[] args) {
    new Getdata();

 }
   } 

Благодарю.

  • 0
    Спасибо большое, раввин, это сработало как шарм! :)

Ещё вопросы

Сообщество Overcoder
Наверх
Меню