Как удалить HTML-элемент String? [Дубликат]

0

Я хочу удалить HTML строки в Java.

<hr><b><strong>Task Details</strong></b><hr><b>Date Created: </b> 01/06/2014 07:55pm<br><b>Date Modified: </b> 01/06/2014 07:55pm<br><b>Assigned to: </b> Administrator<br><b>Created By: </b> Administrator<br><b>Status: </b> Not Started<br><b>Description: </b> Test Description<br>.

Выше моя строка, и я хочу удалить теги HTML.

  • 0
    Это HTML-теги? Кажется, что ввод не имеет HTML-тегов.
  • 0
    вопрос недостаточно ясен. О какой строке вы говорите и какой тег HTML? Не могли бы вы уточнить вопрос и указать, чего именно вы хотите достичь?
Показать ещё 2 комментария
Теги:

2 ответа

4

Возможно, это сработает:

String noHTMLString = htmlString.replaceAll("\\<.*?>","");

Он использует регулярные выражения для удаления всех тегов HTML в строке.

Более конкретно, он удаляет все теги, подобные XML, из строки. Таким образом, <1234> будет удалено, даже если он не является допустимым тегом HTML. Но это хорошо для большинства намерений и purpouses.

Надеюсь это поможет.

Это действительно мертво просто с Jsoup.

public static String html2text(String html) {
    return Jsoup.parse(html).text();
}
  • 2
    -1 Первая часть вашего ответа вплоть до «Надеюсь, что это поможет» скопирована дословно и не приписана этому предыдущему ответу . Если вы не тот же плакат, это большой сетевой этикет нет-нет.
1

Для этого вы можете использовать библиотеку Jsoup.

String str="<h3>My Text</h3>";
System.out.println(Jsoup.parse(str).text());

Вышеупомянутый код блокирует все htms-теги и дает текст влево как вывод

Ещё вопросы

Сообщество Overcoder
Наверх
Меню