Каков самый простой способ узнать, находится ли позиция в теге HTML в строке, содержащей текст в формате html?
Пример:
Это может быть мой текст:
This is a text <a href="http://foo.com"> and this </a> is also <b>part</b> of the <b /> text.
Учитывая позицию x, как я могу проверить, есть ли в данный момент HTML-тег или нет? Полагаю, мне нужно будет проверить, есть ли у меня одна из этих ситуаций (* моя позиция):
- < * > ... </>
- <...> * </>
- < * />
Но каков эффективный подход к этому?
У вас есть ответы на это по этой ссылке:
В принципе, используйте некоторую библиотеку, чтобы выполнить синтаксический анализ html. Я лично использовал JSoup несколько месяцев назад, и он отлично работал.
В следующий раз поиск сначала;)
ContentHandler
уведомляется о каждом элементе; Вы можете проверить наличие целевой строки там.
<...> < * > ... </> </>
будет соответствовать 1 и 2.