Как заменить «» на «»

Question

Как заменить «» на «»

0

Поэтому я хочу заменить все " из файла, который мой код Java читает ни с чем. Просто так все" удаляются ", и я могу написать нужную мне информацию. Например, файл содержит:

<span class="positive">This is the text i want</span>

Как удалить "postive"?

Это мой код:

public static void writeTXT(String j) throws IOException {

    j = j.replaceAll(">", "");
    j = j.replaceAll("<", "");
    for (int i = 0;i < REPLACE.length;i++) {
        j = j.replace(REPLACE[i], "");
    }


public final static String[] REPLACE = {
    "onth Change <span class=\"stay\">",
    "/span/li"
};

Werkverkeer 18 апр. 2014, в 19:43

Источник

3

Действительно непонятно, что именно вы спрашиваете, но кажется, что вы пытаетесь анализировать и извлекать вещи из HTML, и для этого вам следует использовать анализатор XML.
Brian Roach 18 апр. 2014, в 16:51
0

Возможно, вам будет интересно посмотреть на JSoup ... это очень простой в использовании анализатор HTML для Java. jsoup.org
SnakeDoc 18 апр. 2014, в 16:51
0

Он просто хочет удалить текст между " "
Marco Acierno 18 апр. 2014, в 16:52
0

@MarcoAcierno да, но использование регулярного выражения для этого, вероятно, приведет к ошибке. Использовать такой анализатор, как JSoup, очень легко и без ошибок.
SnakeDoc 18 апр. 2014, в 16:53
0

@MarcoAcierno Нет, похоже, что ОП хочет получить «Это текст, который я хочу», и они прыгают через все виды обручей, вместо того чтобы использовать парсер XML.
Brian Roach 18 апр. 2014, в 16:59
0

@BrianRoach "Как мне удалить" позитивные "?" я вижу этот вопрос
Marco Acierno 18 апр. 2014, в 17:00
0

@MarcoAcierno с JSoup это очень просто - именно поэтому он был создан именно для той цели, которую имеет в виду ОП - jsoup.org/cookbook/modifying-data/set-html
SnakeDoc 18 апр. 2014, в 17:01
0

@MarcoAcierno А потом, видимо, перестал читать там вместо того, чтобы смотреть на код и то, что он делает.
Brian Roach 18 апр. 2014, в 17:01
0

@BrianRoach Может быть, его код неправильный? Если он знает, как делать то, что он хочет, он делает это, а не публикует. PS Я не говорю, что вы можете использовать регулярные выражения для разбора XML / HTML
Marco Acierno 18 апр. 2014, в 17:01

Показать ещё 7 комментариев

Теги:

java

html

file-io

2 ответа

0

Хотя верно, что вы должны использовать XML-синтаксический анализатор для извлечения текста из HTML, следующий код будет удалять все между двойными кавычками

    String html = "<span class=\"positive\">This is the text i want</span>";
    System.out.println( html.replaceAll("\"[^\"]*\"", "\"\"" ));
    // <span class="">This is the text i want</span>

Juan Mendes 18 апр. 2014, в 14:11

Ещё вопросы

Действительно непонятно, что именно вы спрашиваете, но кажется, что вы пытаетесь анализировать и извлекать вещи из HTML, и для этого вам следует использовать анализатор XML.
Возможно, вам будет интересно посмотреть на JSoup ... это очень простой в использовании анализатор HTML для Java. jsoup.org
Он просто хочет удалить текст между " "
@MarcoAcierno да, но использование регулярного выражения для этого, вероятно, приведет к ошибке. Использовать такой анализатор, как JSoup, очень легко и без ошибок.
@MarcoAcierno Нет, похоже, что ОП хочет получить «Это текст, который я хочу», и они прыгают через все виды обручей, вместо того чтобы использовать парсер XML.
@BrianRoach "Как мне удалить" позитивные "?" я вижу этот вопрос
@MarcoAcierno с JSoup это очень просто - именно поэтому он был создан именно для той цели, которую имеет в виду ОП - jsoup.org/cookbook/modifying-data/set-html
@MarcoAcierno А потом, видимо, перестал читать там вместо того, чтобы смотреть на код и то, что он делает.
@BrianRoach Может быть, его код неправильный? Если он знает, как делать то, что он хочет, он делает это, а не публикует. PS Я не говорю, что вы можете использовать регулярные выражения для разбора XML / HTML

Adrian Adamczyk · Accepted Answer · 2014-04-18T14-50-00.000Z

0

Лучший ответ

Что вы пытаетесь сделать, это проанализировать HTML с регулярным выражением. Только Чак Норрис может анализировать HTML с регулярными выражениями.

Если вы хотите получить эту подстроку, вам нужно написать собственный синтаксический анализатор, который анализирует строку по буквам или использует существующий для анализа HTML.

Adrian Adamczyk 18 апр. 2014, в 14:50

1

Или используйте уже созданный и очень хороший HTML-парсер для Java, такой как JSoup. Не изобретай велосипед, ты сделаешь это неправильно.
SnakeDoc 18 апр. 2014, в 16:54
0

Хотя я согласен с вашим утверждением, только Чак Норрис может правильно анализировать HTML с помощью регулярных выражений, вопросы остаются в силе, люди часто используют регулярные выражения для извлечения данных из HTML, а не для полного анализа.
Juan Mendes 18 апр. 2014, в 16:55
0

@JuanMendes единственный способ сделать это, и убедиться, что он всегда точен, это использовать JSoup. Использование регулярного выражения для этого приведет к ошибкам. Если OP пишет код для анализа только 1 конкретной HTML-страницы, которая никогда не изменится, тогда обязательно напишите регулярное выражение. в противном случае используйте синтаксический анализатор и несколько команд, таких как; Element positiveClass = doc.select("span.positive").first(); он может быть в пути.
SnakeDoc 18 апр. 2014, в 16:58
0

jsoup.org/cookbook/modifying-data/set-html
SnakeDoc 18 апр. 2014, в 16:59
0

@ SnakeDoc Я не говорю, что синтаксический анализатор XML не лучше, я говорю, что если HTML находится под вашим контролем, регулярное выражение может выполнить эту работу
Juan Mendes 18 апр. 2014, в 16:59

Показать ещё 3 комментария