Regex lookahead, lookbehind и атомные группы

Question

Regex lookahead, lookbehind и атомные группы

330

Я нашел эти вещи в своем теле регулярных выражений, но у меня нет понятия, для чего я могу их использовать. Есть ли у кого-нибудь примеры, чтобы я мог понять, как они работают?

(?!) - negative lookahead
(?=) - positive lookahead
(?<=) - positive lookbehind
(?<!) - negative lookbehind

(?>) - atomic group

Spidfire 04 июнь 2010, в 12:09

Источник

18

Почему на сайте regex нет такой простой таблицы? Вместо этого у них есть блоки текста, объясняющие только. regular-expressions.info/lookaround.html
Whitecat 22 авг. 2016, в 17:30
3

@Whitecat Попробуйте: regex101.com regexr.com
Andrew 28 март 2017, в 14:18

Теги:

regex

lookaround

3 ответа

190

Оценки - это утверждения с нулевой шириной. Они проверяют регулярное выражение (вправо или влево от текущей позиции - на основе вперед или назад), преуспевают или терпят неудачу, когда совпадение найдено (на основе положительного или отрицательного) и отбрасывает согласованную часть. Они не потребляют никакого символа - соответствие для регулярного выражения, следующего за ними (если есть), будет начинаться с одной и той же позиции курсора.

Подробнее читайте regular-expression.info.

Положительный взгляд:

Синтаксис:

(?=REGEX_1)REGEX_2

Соответствует только если соответствует REGEX_1; после сопоставления REGEX_1 совпадение отбрасывается и поиск REGEX_2 начинается с той же позиции.

Пример:

(?=[a-z0-9]{4}$)[a-z]{1,2}[0-9]{2,3}

REGEX_1 - это [a-z0-9]{4}$, который соответствует четырем буквенно-цифровым символам, за которыми следует конец строки.
REGEX_2 - это [a-z]{1,2}[0-9]{2,3}, который соответствует одной или двум буквам, за которыми следуют две или три цифры.

REGEX_1 гарантирует, что длина строки действительно равна 4, но не использует никаких символов, поэтому поиск REGEX_2 начинается с того же места. Теперь REGEX_2 гарантирует соответствие строки другим правилам. Без надежного поиска он будет соответствовать строкам длиной три или пять.

Отрицательный взгляд

Синтаксис:

(?!REGEX_1)REGEX_2

Соответствует только если REGEX_1 не соответствует; после проверки REGEX_1 поиск REGEX_2 начинается с той же позиции.

Пример:

(?!.*\bFWORD\b)\w{10,30}$

Просматриваемая часть проверяет FWORD в строке и терпит неудачу, если она ее обнаружит. Если он не находит FWORD, поиск вперед преуспевает, и следующая часть проверяет, что длина строки составляет от 10 до 30 и что она содержит только символы слов a-zA-Z0-9_

Look-behind похож на look-ahead: он просто смотрит за текущую позицию курсора. Некоторые ароматы регулярных выражений, такие как javascript, не поддерживают утверждения look-behind. И большинство ароматов, которые его поддерживают (PHP, Python и т.д.), Требуют, чтобы часть обратного следа имела фиксированную длину.

Атомные группы в основном отбрасывают/забывают последующие токены в группе после совпадения токенов. Просмотрите эту страницу для примеров атомных групп

Amarghosh 04 июнь 2010, в 13:08

0

Следуя вашему объяснению, похоже, не работает в javascript, /(?=source)hello/.exec("source...hummhellosource ") = null. Ваше объяснение правильно?
Helin Wang 01 июнь 2013, в 17:47
0

@HelinWang Это объяснение правильно. Ваше регулярное выражение ожидает строку, которая является одновременно источником и привет!
Amarghosh 04 июнь 2013, в 11:54
0

@jddxf Хотите уточнить?
Amarghosh 04 окт. 2016, в 05:19
0

@Amarghosh Я согласен с «Они проверяют регулярное выражение (вправо или влево от текущей позиции - на основе впереди или сзади), успешно или неудачно, когда найдено совпадение (на основании положительного или отрицательного результата), и отбрасывают совпадающее часть. ". Таким образом, ожидающий запрос должен проверять регулярное выражение вправо от текущей позиции, а синтаксис положительного просмотра должен быть равен x (? = Y)
jddxf 05 окт. 2016, в 11:28
0

@Amarghosh (?=REGEX_1)REGEX_2 только если REGEX_2 будет после REGEX_1 ?
aandis 22 май 2018, в 11:50

Показать ещё 3 комментария

0

Грохоты быстро исчезают.
Как отличить lookahead и lookbehind? Пройдите 2 минуты тура со мной:

(?=) - positive lookahead
(?<=) - positive lookbehind

предполагать

    A  B  C #in a line

Теперь, мы спрашиваем B, где вы?
B имеет два решения, объявляющих его местоположение:

Один, B имеет A вперед и имеет C bebind
Два, B впереди (lookahead) C и сзади (lookhehind) A.

Как мы видим, в обоих решениях противоположные и дальнейшие противоположны.
Regex - это решение Two.

JawSaw 04 апр. 2018, в 16:02

Ещё вопросы

Почему на сайте regex нет такой простой таблицы? Вместо этого у них есть блоки текста, объясняющие только. regular-expressions.info/lookaround.html
Следуя вашему объяснению, похоже, не работает в javascript, /(?=source)hello/.exec("source...hummhellosource ") = null. Ваше объяснение правильно?
@HelinWang Это объяснение правильно. Ваше регулярное выражение ожидает строку, которая является одновременно источником и привет!
@Amarghosh Я согласен с «Они проверяют регулярное выражение (вправо или влево от текущей позиции - на основе впереди или сзади), успешно или неудачно, когда найдено совпадение (на основании положительного или отрицательного результата), и отбрасывают совпадающее часть. ". Таким образом, ожидающий запрос должен проверять регулярное выражение вправо от текущей позиции, а синтаксис положительного просмотра должен быть равен x (? = Y)
@Amarghosh (?=REGEX_1)REGEX_2 только если REGEX_2 будет после REGEX_1 ?

skyfoot · Accepted Answer · 2010-06-04T12-53-00.000Z

Примеры

Учитывая строку foobarbarfoo:

bar(?=bar)     finds the 1st bar ("bar" which has "bar" after it)
bar(?!bar)     finds the 2nd bar ("bar" which does not have "bar" after it)
(?<=foo)bar    finds the 1st bar ("bar" which has "foo" before it)
(?<!foo)bar    finds the 2nd bar ("bar" which does not have "foo" before it)

Вы также можете объединить их:

(?<=foo)bar(?=bar)    finds the 1st bar ("bar" with "foo" before it and "bar" after it)

Определения

Смотри вперед позитивно `(?=)`

Найдите выражение A, за которым следует выражение B:

A(?=B)

Смотри вперед негатив `(?!)`

Найдите выражение A, где выражение B не следует:

A(?!B)

Смотри за позитивом `(?<=)`

Найдите выражение A, где предшествует выражение B:

(?<=B)A

Смотреть за минусом `(?<!)`

Найдите выражение A, где выражение B не предшествует:

(?<!B)A

Атомные группы `(?>)`

Атомная группа выходит из группы и выбрасывает альтернативные шаблоны после первого сопоставленного шаблона внутри группы (обратное отслеживание отключено).

(?>foo|foot)s примененные к foots будут соответствовать его 1-му альтернативному foo, затем потерпят неудачу, поскольку s не сразу следует, и остановится, поскольку обратный трекинг отключен

Неатомарная группа позволит вернуться назад; если последующее сопоставление не удастся, оно будет возвращаться и использовать альтернативные шаблоны, пока не будет найдено совпадение для всего выражения или не исчерпаны все возможности.

(foo|foot)s применяется к foots:
1. сопоставьте его 1-й альтернативе foo, затем потерпите неудачу, так как s не сразу следует в foots, и вернитесь к его 2-й альтернативе;
2. сопоставьте его 2-ю альтернативную foot, затем добейтесь успеха, поскольку s немедленно следует в foots, и остановитесь

Некоторые ресурсы

Что вы подразумеваете под "находит второй бар" часть? В выражении / строке есть только одна строка. Спасибо
@ziggy проверяемая строка - "foobarbarfoo". Как вы можете видеть, в строке есть два foo и два бара.
@ziggy попробуйте зайти на pythex.org и немного поиграть с этим. вы поймете это полностью
Поместите две строки рядом, как, например, barbar текста в тексте, на котором будут опробованы эти регулярные выражения.
Может кто-нибудь объяснить, когда может понадобиться атомная группа? Если мне нужно сопоставить только первый вариант, зачем мне предлагать несколько вариантов?
@skyfoot или кто-нибудь еще здесь. Я вижу, что "(? <= B) A" просмотр сзади всегда перед фактическим поиском. Означает ли это, что всегда должно быть раньше? Можно ли это также сделать "A (? <= B)"? Как следует из названия, он выглядит «сзади» и «впереди». Спасибо, если кто-нибудь может объяснить.
Лучшее объяснение атомной группы в этом ответе . Может ли кто-нибудь отредактировать здесь, чтобы завершить этот диатический ответ?

Regex lookahead, lookbehind и атомные группы

3 ответа

Примеры

Определения

Смотри вперед позитивно (?=)

Смотри вперед негатив (?!)

Смотри за позитивом (?<=)

Смотреть за минусом (?<!)

Атомные группы (?>)

Некоторые ресурсы

Ещё вопросы

Смотри вперед позитивно `(?=)`

Смотри вперед негатив `(?!)`

Смотри за позитивом `(?<=)`

Смотреть за минусом `(?<!)`

Атомные группы `(?>)`