Проверьте, находится ли позиция / символ внутри тега HTML

0

Каков самый простой способ узнать, находится ли позиция в теге HTML в строке, содержащей текст в формате html?

Пример:

Это может быть мой текст:

This is a text <a href="http://foo.com"> and this </a> is also <b>part</b> of the <b /> text.

Учитывая позицию x, как я могу проверить, есть ли в данный момент HTML-тег или нет? Полагаю, мне нужно будет проверить, есть ли у меня одна из этих ситуаций (* моя позиция):

- < * > ... </>
- <...> * </> 
- < * />

Но каков эффективный подход к этому?

  • 0
    Следует отметить, что ваши 3 ситуации не являются взаимоисключающими. То есть: <...> < * > ... </> </> будет соответствовать 1 и 2.
  • 0
    Правда, но я работаю с довольно простым HTML в этом случае. Вложенных тегов не будет.
Показать ещё 2 комментария
Теги:
parsing

1 ответ

2

У вас есть ответы на это по этой ссылке:

Анализ HTML в Java

В принципе, используйте некоторую библиотеку, чтобы выполнить синтаксический анализ html. Я лично использовал JSoup несколько месяцев назад, и он отлично работал.

В следующий раз поиск сначала;)

  • 0
    Если создание DOM-представления (большого) HTML-документа не требуется, то SAX-анализатор вполне подойдет. ContentHandler уведомляется о каждом элементе; Вы можете проверить наличие целевой строки там.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню