Получить текст с URL

Question

Получить текст с URL

0

Я пытаюсь получить весь текст URL-адреса с помощью Jsoup, это код:

Document doc = Jsoup.connect(Url).get();
System.out.println(doc.text());

Но проблема в том, что это не работает нормально для всех URL, которые я пробовал... Мне нужно получить весь текст с веб-страницы (разбор HTML), потому что я реализую прокси с помощью сокетов, и мне нужно подключиться к URL-адрес, затем найдите выбранное слово и, если оно существует, мне нужно заблокировать указанный URL-адрес, если он не существует, веб-страница возвращается в браузер.

Есть ли другой способ получить весь текст с веб-страницы?

Благодарю!

user2994057 15 дек. 2013, в 19:23

Источник

1

problem is that this is not working fine for all the URL's I tried... как именно это не работает? Можете ли вы привести несколько примеров ввода, фактического и ожидаемого результата?
Pshemo 15 дек. 2013, в 17:56
1

как насчет того, чтобы вообще не использовать Jsoup и попробовать что-то вроде этого: URL url = новый URL (args [0]); Scanner scan = новый сканер (url.openStream ()); while (scan.hasNextLine ()) // используем api документа для вставки в него строк}
Ashish 15 дек. 2013, в 18:06

Теги:

java

html

jsoup

proxy

1 ответ

Ещё вопросы

problem is that this is not working fine for all the URL's I tried... как именно это не работает? Можете ли вы привести несколько примеров ввода, фактического и ожидаемого результата?
как насчет того, чтобы вообще не использовать Jsoup и попробовать что-то вроде этого: URL url = новый URL (args [0]); Scanner scan = новый сканер (url.openStream ()); while (scan.hasNextLine ()) // используем api документа для вставки в него строк}

Rabbi · Answer 1 · 2013-12-15T16-56-00.000Z

Если я правильно понял, вы хотите, чтобы весь текст с веб-страницы, правильно? Этот код должен получить все тексты с веб-страницы.

  import org.jsoup.*;
  import org.jsoup.nodes.*;
  import org.jsoup.select.*;

  public class Getdata {
    public Getdata() {
      try {
           String url = "http://stackoverflow.com/questions/20597755/get-text-from-url";
           Document doc = Jsoup.connect(url).get();
           Elements element = doc.select("p");

           for (Element t : element) {
             System.out.println(t.text());
           }

         } catch (Exception ex) {
           System.err.println(ex);

      }
}

public static void main(String[] args) {
    new Getdata();

 }
   }

Благодарю.

Спасибо большое, раввин, это сработало как шарм! :)