Как отрицать конкретное слово в регулярных выражениях?

Question

Как отрицать конкретное слово в регулярных выражениях?

494

Я знаю, что я могу отрицать группу символов, как в [^bar], но мне нужно регулярное выражение, где отрицание относится к конкретному слову - так что в моем примере, как я отрицаю фактический "bar", а не "any chars in bar"?

Bostone 06 авг. 2009, в 18:26

Источник

1

Возможно, дубликат регулярного выражения соответствует строке, которая не содержит слова?
Steve Chambers 25 окт. 2016, в 10:44

Теги:

regex

10 ответов

58

Если производительность не вызывает особой озабоченности, часто проще просто выполнить свои результаты через второй проход, пропуская те, которые соответствуют словам, которые вы хотите скрыть.

Регулярные выражения обычно означают, что вы все равно выполняете скрипты или какую-то низкопроизводительную задачу, поэтому находите решение, которое легко читать, легко понять и легко поддерживать.

Bryan Oakley 06 авг. 2009, в 19:24

3

Есть много ситуаций, когда вы не контролируете рабочий процесс: вы просто пишете одно регулярное выражение, которое является фильтром.
Steve Bennett 22 март 2018, в 04:08

40

Следующее регулярное выражение будет делать то, что вы хотите (до тех пор, пока поддерживаются отрицательные lookbehinds и lookaheads), правильно подходящие вещи; единственная проблема заключается в том, что он соответствует отдельным символам (т.е. каждое совпадение - это один символ, а не все символы между двумя последовательными "барами" ), что может привести к высоким накладным расходам, если вы работаете с очень длинными строками.

b(?!ar)|(?<!b)a|a(?!r)|(?<!ba)r|[^bar]

JAB 06 авг. 2009, в 18:27

6

Вместо тех многочисленных обновлений, которые вынуждают нас читать неправильные ответы, прежде чем мы дойдем до вашего окончательного ответа, почему бы не переписать ваш ответ, чтобы он был полным, но без несколько запутанных плохих частей? Если кого-то действительно волнует история редактирования, он может использовать встроенные функции этого сайта.
Bryan Oakley 19 июнь 2012, в 13:12
12

Прошло два с половиной года с тех пор, как я написал этот ответ, но уверен.
JAB 19 июнь 2012, в 14:39
3

блин, больно, попробуйте это (? :( ?! bar).) *
Bob 07 окт. 2014, в 18:15
0

@ Мэри, это не будет работать, как ожидалось. Например, /(?:(?!bar).)*/g на foobar возвращает foo AND ar .
Krzysiek 07 янв. 2015, в 16:08

Показать ещё 2 комментария

37

Вы можете использовать негативный внешний вид или внешний вид:

^(?!.*?bar).*
^(.(?<!bar))*?$

Или используйте только основы:

^(?:[^b]+|b(?:$|[^a]|a(?:$|[^r])))*$

Все они соответствуют всем, что не содержит bar.

Gumbo 06 авг. 2009, в 18:18

0

Какие языки не поддерживают (отрицательные) упреждения и / или (отрицательные) упреждения в регулярных выражениях?
JAB 06 авг. 2009, в 17:29
5

Я думаю, что суть в том, что, глядя на ваш паттерн, совсем не ясно, что все, что вы делаете - это отказываетесь от слова «бар».
Bryan Oakley 06 авг. 2009, в 17:34
0

@ Брайан: И, фактически, он не отвергает слово «бар». Он просто отклоняет «b», когда следует «ar».
JAB 06 авг. 2009, в 18:05
0

Хорошая идея, но не поддерживается везде. Afaik Javascript поддерживает отрицательный прогноз, но не прогноз. Я не знаю подробностей о других языках, но это может быть полезно: en.wikipedia.org/wiki/Comparison_of_regular_expression_engines
mik01aj 08 июль 2015, в 07:58
0

@JAB bash не поддерживает отрицательный взгляд в будущее.
niieani 02 март 2016, в 14:18
3

(?:[^b][^a][^r])*
EKons 19 апр. 2016, в 17:14
0

@JAB прогнозирование и прогнозирование не являются posix
untore 06 янв. 2018, в 10:23
0

@JAB RE2 (таблицы Google) не поддерживает его.
atwixtor 23 апр. 2018, в 13:48

Показать ещё 6 комментариев

25

Я наткнулся на этот форум, пытаясь идентифицировать регулярное выражение для следующего английского заявления:

Учитывая входную строку, сопоставьте все, если только эта строка ввода не является "баром"; например, я хочу совместить "барьер" и "запрет", а также "foo".

Здесь regex я придумал

^(bar.+|(?!bar).*)$

Мой английский перевод регулярного выражения "соответствует строке, если она начинается с" bar ", и у нее есть хотя бы один другой символ, или если строка не начинается с" bar ".

ReQuest Programmer 10 сен. 2010, в 21:03

0

@ReReqest - у вас будет гораздо больше шансов получить ответ на этот вопрос, если вы разместите его как отдельный вопрос. В этом вы можете предоставить ссылку на этот вопрос, если хотите. По существу вопроса - это выглядит хорошо, но я не гуру регулярных выражений
Bostone 11 сен. 2010, в 17:47
1

Это был тот, кого я искал. Это действительно соответствует всему, кроме бара.
Gabriel Hautclocq 17 дек. 2015, в 20:34
1

^(?!bar$).* совпадает с этим (все, кроме точно bar ) и избегает повторения.
bkDJ 06 июнь 2018, в 13:17

Показать ещё 1 комментарий

22

Решение:

^(?!.*STRING1|.*STRING2|.*STRING3).*$

xxxxxx ОК

xxxSTRING1xxx KO (желательно ли это)

xxxSTRING2xxx KO (желательно ли это)

xxxSTRING3xxx KO (желательно ли это)

sgrillon 13 сен. 2016, в 16:26

2

спасибо, это дало мне дополнительную информацию, необходимую для нескольких слов
RozzA 30 окт. 2016, в 18:37

5

Принятый ответ хорош, но на самом деле является обходным процессом из-за отсутствия простого оператора выражения выражения выражений выражения в регулярных выражениях. Вот почему grep --invert-match завершает работу. Таким образом, в * nixes вы можете выполнить желаемый результат с помощью труб и второго регулярного выражения.

grep 'something I want' | grep --invert-match 'but not these ones'

Все еще обходной путь, но, возможно, легче запомнить.

Greg Bell 04 янв. 2016, в 01:20

2

Я надеюсь дополнить ответ

Как уточнил Крис Regex Tutorial - лучший ресурс для обучения регулярному выражению.

Однако он действительно потреблял время для чтения.

Я делаю чит-коды для удобства мнемоники.
[], (), {} ведущие к каждому классу, который легко вспомнить.

Regex =
{'single_character': ['[]', '.', {'negate':'^'}],
 'capturing_group' : ['()', '|', '\\', 'backreferences and named group'],
 'repetition'      : ['{}', '*', '+', '?', 'greedy v.s. lazy'],
 'anchor'          : ['^', '\b', '$'],
 'non_printable'   : ['\n', '\t', '\r', '\f', '\v'],
 'shorthand'       : ['\d', '\w', '\s'],
 }

JawSaw 06 дек. 2017, в 06:58

1

У меня был список имен файлов, и я хотел исключить некоторые из них с таким поведением (Ruby):

files = [
  'mydir/states.rb',      # don't match these
  'countries.rb',
  'mydir/states_bkp.rb',  # match these
  'mydir/city_states.rb' 
]
excluded = ['states', 'countries']

# set my_rgx here

result = WankyAPI.filter(files, my_rgx)  # I didn't write WankyAPI...
assert result == ['mydir/city_states.rb', 'mydir/states_bkp.rb']

Здесь мое решение:

excluded_rgx = excluded.map{|e| e+'\.'}.join('|')
my_rgx = /(^|\/)((?!#{excluded_rgx})[^\.\/]*)\.rb$/

Мои предположения для этого приложения:

Строка, которая должна быть исключена, находится в начале ввода или сразу же после косой черты.
Допустимые строки заканчиваются на .rb.
Допустимые имена файлов не имеют символа . перед .rb.

Chaim Leib Halbert 06 нояб. 2015, в 13:18

1

Просто подумал о чем-то другом, что можно было бы сделать. Это очень отличается от моего первого ответа, поскольку он не использует регулярные выражения, поэтому я решил сделать второй ответ.

Используйте свой язык выбора split() эквивалент метода в строке со словом, чтобы отрицать как аргумент для разделения. Пример использования Python:

>>> text = 'barbarasdbarbar 1234egb ar bar32 sdfbaraadf'
>>> text.split('bar')
['', '', 'asd', '', ' 1234egb ar ', '32 sdf', 'aadf']

Хорошая вещь в этом, по крайней мере, в Python (я не помню, была ли функциональность такой же, например, Visual Basic или Java), заключается в том, что она позволяет вам опознать, когда "bar" был повторен в строке из-за того, что пустые строки между "bar" s включены в список результатов (хотя пустая строка в начале происходит из-за наличия "бара" в начале строки). Если вы этого не хотите, вы можете просто удалить пустые строки из списка.

JAB 07 авг. 2009, в 21:35

0

Вопрос специально задает о регулярных выражениях ...
Ajk_P 22 июнь 2017, в 18:25
2

@Ajk_P да, но ответы такого типа могут помочь оператору мыслить нестандартно, они могли быть зациклены на регулярных выражениях, не понимая, что их можно решить без них.
Petruza 21 июль 2017, в 15:53

Ещё вопросы

Возможно, дубликат регулярного выражения соответствует строке, которая не содержит слова?
Есть много ситуаций, когда вы не контролируете рабочий процесс: вы просто пишете одно регулярное выражение, которое является фильтром.
Вместо тех многочисленных обновлений, которые вынуждают нас читать неправильные ответы, прежде чем мы дойдем до вашего окончательного ответа, почему бы не переписать ваш ответ, чтобы он был полным, но без несколько запутанных плохих частей? Если кого-то действительно волнует история редактирования, он может использовать встроенные функции этого сайта.
Прошло два с половиной года с тех пор, как я написал этот ответ, но уверен.
блин, больно, попробуйте это (? :( ?! bar).) *
@ Мэри, это не будет работать, как ожидалось. Например, /(?:(?!bar).)*/g на foobar возвращает foo AND ar .
Какие языки не поддерживают (отрицательные) упреждения и / или (отрицательные) упреждения в регулярных выражениях?
Я думаю, что суть в том, что, глядя на ваш паттерн, совсем не ясно, что все, что вы делаете - это отказываетесь от слова «бар».
@ Брайан: И, фактически, он не отвергает слово «бар». Он просто отклоняет «b», когда следует «ar».
Хорошая идея, но не поддерживается везде. Afaik Javascript поддерживает отрицательный прогноз, но не прогноз. Я не знаю подробностей о других языках, но это может быть полезно: en.wikipedia.org/wiki/Comparison_of_regular_expression_engines
@JAB bash не поддерживает отрицательный взгляд в будущее.
@JAB прогнозирование и прогнозирование не являются posix
@JAB RE2 (таблицы Google) не поддерживает его.
@ReReqest - у вас будет гораздо больше шансов получить ответ на этот вопрос, если вы разместите его как отдельный вопрос. В этом вы можете предоставить ссылку на этот вопрос, если хотите. По существу вопроса - это выглядит хорошо, но я не гуру регулярных выражений
Это был тот, кого я искал. Это действительно соответствует всему, кроме бара.
^(?!bar$).* совпадает с этим (все, кроме точно bar ) и избегает повторения.
спасибо, это дало мне дополнительную информацию, необходимую для нескольких слов
Вопрос специально задает о регулярных выражениях ...
@Ajk_P да, но ответы такого типа могут помочь оператору мыслить нестандартно, они могли быть зациклены на регулярных выражениях, не понимая, что их можно решить без них.

Chris Van Opstal · Accepted Answer · 2009-08-06T19-29-00.000Z

577

Лучший ответ

Отличный способ сделать это - использовать негативный взгляд:

^(?!.*bar).*$

Конструкция негативного прогноза представляет собой пару круглых скобок с открывающей скобкой, за которой следует вопросительный знак и восклицательный знак. Внутри lookahead [является любым шаблоном регулярного выражения].

Chris Van Opstal 06 авг. 2009, в 19:29

9

Это говорит само за себя (я бы, наверное, начал с (?! Bar) и наращивал). Я не понимаю, почему другие люди делают это так сложно.
Beta 07 авг. 2009, в 14:49
32

К сожалению, это не работает со всеми языками.
JAB 07 авг. 2009, в 18:01
4

Символ начала строки в начале делает довольно хорошую работу.
dhblah 23 окт. 2012, в 08:39
0

Я не думаю, что легковесные парсеры регулярных выражений, такие как поддержка SLRE! Оператор еще.
enthusiasticgeek 28 фев. 2014, в 12:49
2

Отлично сделано - соответствует строке, которая имеет указанную строку, и перед строкой ничего не предшествует, а за строкой следует что-нибудь. Это по определению отсутствие строки! потому что если он присутствует, ему всегда будет предшествовать что-то, даже если это якорь строки ^
Pete_ch 13 нояб. 2014, в 15:35
0

Есть ли версия этого, которая работает в утилите grep командной строки Linux?
Neil Traft 27 сен. 2015, в 02:03
0

@NeilTraft как насчет grep -v bar :)
bobbel 12 авг. 2016, в 16:00
0

Если вы используете grep, используйте опцию -P. -P включает регулярное выражение Perl. например, grep -P '(?! не содержат эту строку)'
seenimurugan 21 сен. 2016, в 13:32
0

это сработало "правильно" с дополнительной информацией, предоставленной ответом @ sgrillon
RozzA 30 окт. 2016, в 18:36
0

Я не хочу, чтобы пользователь мог написать «Пароль», «Пароль» или любое другое точное слово.
Irfan Nasim 31 март 2017, в 06:15
1

К сожалению, это не работает с реальными словами. foo будет соответствовать, bar не будет, но foobar или barfoo тоже не будет!
bzim 30 июнь 2017, в 21:01
0

Это супер полезно для идемпотентной замены
Lucas 13 сен. 2017, в 22:20

Показать ещё 10 комментариев