Поэтому я хочу заменить все "
из файла, который мой код Java читает ни с чем. Просто так все" удаляются ", и я могу написать нужную мне информацию. Например, файл содержит:
<span class="positive">This is the text i want</span>
Как удалить "postive"
?
Это мой код:
public static void writeTXT(String j) throws IOException {
j = j.replaceAll(">", "");
j = j.replaceAll("<", "");
for (int i = 0;i < REPLACE.length;i++) {
j = j.replace(REPLACE[i], "");
}
public final static String[] REPLACE = {
"onth Change <span class=\"stay\">",
"/span/li"
};
Что вы пытаетесь сделать, это проанализировать HTML с регулярным выражением. Только Чак Норрис может анализировать HTML с регулярными выражениями.
Если вы хотите получить эту подстроку, вам нужно написать собственный синтаксический анализатор, который анализирует строку по буквам или использует существующий для анализа HTML.
Хотя верно, что вы должны использовать XML-синтаксический анализатор для извлечения текста из HTML, следующий код будет удалять все между двойными кавычками
String html = "<span class=\"positive\">This is the text i want</span>";
System.out.println( html.replaceAll("\"[^\"]*\"", "\"\"" ));
// <span class="">This is the text i want</span>