Текст соответствия PHP RegEx НЕ в теге привязки

Question

Текст соответствия PHP RegEx НЕ в теге привязки

1

Regex немного над моей головой, но я пытаюсь учиться.

У меня есть рабочее регулярное выражение, которое я использую в preg_replace, чтобы соответствовать строке и заменить ее ссылкой html. Он правильно избегает, когда совпадения находятся внутри тегов привязки, если в теге привязки нет дочернего тега.

Здесь (обновленный) шаблон:

/(?!(?:[^<]+>|[^>]+<\/a>))\b(Match Me)\b/is

И некоторый образец текста:

<a href="#">Don't Match Me <span>web</span></a>
<a href="#">Don't Match Me</a>
Match Me
<span>Match Me</span>

Вышеупомянутое регулярное выражение будет соответствовать тексту на 1-й, 3-й и 4-й строках. Тем не менее, я хочу только совместить текст "Match Me" на 3-й и 4-й строках.

ПРИМЕЧАНИЕ. Содержимое, которое я просеиваю, не просто разделяется линиями, как в моем примере. Это абзац текста.

Я открыт для использования DOM, но я беру большой блок контента и применяю несколько замен, используя функцию массива preg_replace, например:

preg_replace($searchFor, $linkArray, $content);

где $ searchFor и $ linkArray - это многомерные массивы с соответствующими ключами, содержащими шаблон и замену html соответственно.

Любая помощь приветствуется!

danbrellis 08 окт. 2015, в 18:00

Источник

0

Вы хотите соответствовать целой 4-й линии? или просто "Соедини меня"?
mayo 08 окт. 2015, в 17:17
0

Является ли набор тегов, которые обернут 'Foo Bar' конечным? Это просто <span> .... </ span> или это могут быть другие теги, такие как <em>, <strong>, <b> и т. Д.? Предполагается ли принимать во внимание недопустимый или небрежный html, например: <span> foo bar </ div>, или такие вещи, как <h2> foo bar </ h2>?
Lizardx 08 окт. 2015, в 19:34
0

только что увидел ваш комментарий, просто сопоставьте меня на 4-й строке - см. мой отредактированный вопрос.
danbrellis 08 окт. 2015, в 22:01
0

lizardx - могут быть другие теги, все, что будет допустимо внутри тега <a>. Теоретически не будет никакого небрежного HTML.
danbrellis 08 окт. 2015, в 22:04

Показать ещё 2 комментария

Теги:

php

regex

3 ответа

1

Обновите комментарий, чтобы ответить:

match me(?!.*?\<\/a\>)

https://regex101.com/r/hH3rL1/1

user993553 09 окт. 2015, в 17:14

0

Это принятый ответ, но он не работает на моем движке регулярных выражений (Sublime Text 2) ... он соответствует всем строкам.
geoidesic 05 янв. 2017, в 17:20
0

Однако это не работает, если <a href="#">Don't Match Me</a> match me <a href="#">Don't Match Me</a> совпадение находится между двумя тегами привязки, т. <a href="#">Don't Match Me</a> match me <a href="#">Don't Match Me</a>
Tomeh 02 май 2017, в 09:04

0

Я изменил ваше регулярное выражение, чтобы найти якоря и избежать выбора этой строки.

/^(?!.*(\<a.*?\>)).*$/ism

https://regex101.com/r/kE4mJ0/1

mayo 08 окт. 2015, в 17:52

0

Mayo- большое спасибо за то, что взглянули на это. Я думаю, я не был кристально чистым. Это не обязательно в отдельных строках, это может быть <a href="#"> Не подходить мне <span> Интернет </ span> </a> <a href="#"> Не надо t Match Me </a> Match Me <span> Match Me </ span>. И мне нужно иметь возможность сопоставлять конкретный текст «Match Me» ... если только он не находится внутри тега привязки.
danbrellis 08 окт. 2015, в 22:00
1

соответствовать мне (?!. *? \ <\ / a \>), это работает для проблемы с yopur?
user993553 09 окт. 2015, в 03:51
0

да, я думаю это все! Не могли бы вы добавить это в качестве ответа?
danbrellis 09 окт. 2015, в 13:58
0

Похоже, решение @ user993553 - это то, что вы ищете!
mayo 09 окт. 2015, в 16:44

Показать ещё 2 комментария

Ещё вопросы

Вы хотите соответствовать целой 4-й линии? или просто "Соедини меня"?
Является ли набор тегов, которые обернут 'Foo Bar' конечным? Это просто <span> .... </ span> или это могут быть другие теги, такие как <em>, <strong>, <b> и т. Д.? Предполагается ли принимать во внимание недопустимый или небрежный html, например: <span> foo bar </ div>, или такие вещи, как <h2> foo bar </ h2>?
только что увидел ваш комментарий, просто сопоставьте меня на 4-й строке - см. мой отредактированный вопрос.
lizardx - могут быть другие теги, все, что будет допустимо внутри тега <a>. Теоретически не будет никакого небрежного HTML.
Это принятый ответ, но он не работает на моем движке регулярных выражений (Sublime Text 2) ... он соответствует всем строкам.
Однако это не работает, если <a href="#">Don't Match Me</a> match me <a href="#">Don't Match Me</a> совпадение находится между двумя тегами привязки, т. <a href="#">Don't Match Me</a> match me <a href="#">Don't Match Me</a>
Mayo- большое спасибо за то, что взглянули на это. Я думаю, я не был кристально чистым. Это не обязательно в отдельных строках, это может быть <a href="#"> Не подходить мне <span> Интернет </ span> </a> <a href="#"> Не надо t Match Me </a> Match Me <span> Match Me </ span>. И мне нужно иметь возможность сопоставлять конкретный текст «Match Me» ... если только он не находится внутри тега привязки.
соответствовать мне (?!. *? \ <\ / a \>), это работает для проблемы с yopur?
да, я думаю это все! Не могли бы вы добавить это в качестве ответа?
Похоже, решение @ user993553 - это то, что вы ищете!

Tomeh · Accepted Answer · 2017-05-02T07-27-00.000Z

Совпадение HTML довольно сложно с регулярным выражением. В принятом ответе здесь не учитываются строки, где совпадение находится между двумя отдельными тегами привязки, например:

HTML:

<a href="#">Don't Match Me <span>web</span></a>
match me
<a href="#">Don't Match Me</a>match me<a href="#">Don't Match Me</a>

Раньше я использовал следующее regex, но это будет работать только в php: https://regex101.com/r/v0FfFC/1

Спасибо, что еще раз посмотрел на это. Вы были правы в отношении установки между двумя якорями. Для процветания это регулярное выражение /<a[^>]*>(?:[a-zA-Z0-9\s'\-\.,]|(?:<(.*)>.*<\/\1>))*<\/a>(*SKIP)(*FAIL)|\b(match me)\b(?=[^>]*(?:<|$))/gi
Спасибо, возможно, потребуется настроить для индивидуальных случаев использования