Существует ли регулярное выражение для обнаружения правильного регулярного выражения?

Question

Существует ли регулярное выражение для обнаружения правильного регулярного выражения?

589

Можно ли обнаружить правильное регулярное выражение с другим регулярным выражением? Если да, пожалуйста, дайте пример кода ниже.

psytek 05 окт. 2008, в 16:53

Источник

1

Вышеупомянутое может или не может быть полезным на практике (я не рассмотрел их подробно, и при этом я не являюсь особенно хорошим судьей), но формально, языки регулярных выражений IIRC (по крайней мере некоторые) являются законченными по Тьюрингу, и как таковые это невозможно построить тестер, который будет правильно оценивать правильность всех возможных регулярных выражений на этих языках. См. Теорему Гёделя о неполноте и тезис Черча-Тьюринга.
Gary B 11 нояб. 2008, в 20:05
327

Кто проверяет правильность регулярного выражения?
bevacqua 04 июль 2011, в 00:02
15

@Nico Community.
Janusz Lenar 29 июль 2012, в 13:39
51

@Nico кто regexiet регулярное выражение?
Polynomial 23 окт. 2012, в 12:20
0

Я видел регулярное выражение для разбора регулярных выражений в JavaScript в одном из выступлений Дугласа Крокфорда.
jcubic 16 нояб. 2013, в 16:12
20

Итак, ваша проблема заключается в проверке регулярного выражения, вы выбрали регулярное выражение для его решения. Интересно, является ли свойство регулярного выражения увеличения числа задач аддитивным или мультипликативным? Такое ощущение, что 4 проблемы вместо 2 :)
abesto 18 нояб. 2013, в 14:54
7

Для регулярных выражений существует множество обозначений - некоторые функции и их написание являются общими для большинства, некоторые пишутся по-разному или доступны только в одной конкретной записи. Большинство этих нотаций не являются «регулярными» в смысле обычной грамматики - вам нужен контекстно-свободный синтаксический анализатор для обработки неограниченного вложения подвыражений - хотя многие современные нотации «регулярных выражений» имеют расширения, которые выходят за рамки исходного формального определения и может позволить их собственные нотации быть распознанными. В любом случае, почему бы просто не спросить свою библиотеку регулярных выражений, допустимо ли каждое регулярное выражение?
Steve314 06 апр. 2015, в 11:28
3

@Nico - это все регулярные выражения.
JessieArr 06 апр. 2015, в 13:49
4

@Polynomial Конечно, "Quis testificari ipsos regexes?" было бы лучше.
TerrorBite 06 апр. 2015, в 14:49
0

Я только видел этот вопрос, но много лет назад я написал регулярное выражение Perl для проверки регулярных выражений Perl (а также для обнаружения «опасных» операций по удалению). Это было несколько длиннее, чем регулярное выражение в ответе Маркуса Жардеро! Я полагал, что это было полно в то время, но у меня не было никого другого, чтобы проверить это.
CJ Dennis 07 апр. 2015, в 13:18
35

Я слышал, что вы любите регулярные выражения ...
volter9 23 апр. 2015, в 16:26
0

@bevacqua Мне нужно проверить регулярное выражение в схеме XML. Как я могу сделать это без другого регулярного выражения?
zenden2k 09 сен. 2015, в 11:31
4

Нет, нет; это создаст особенность в пространстве-времени, которая разрушит вселенную, какой мы ее знаем.
Pete Alvin 27 март 2016, в 11:21
0

В некоторых случаях вы можете использовать сторонние сервисы, такие как онлайн-тестер и отладчик regex: regex101.com
Juraj.Lorinc 15 фев. 2017, в 13:45
0

Диктор: настройтесь на следующую неделю для ... "Есть ли регулярное выражение для определения допустимого сценария Perl?"
Nathan Osman 25 март 2017, в 21:16
0

напоминает мне теоремы Гёделя о неполноте. Вы пытаетесь доказать, что вы совершенны, только глядя на себя в зеркало? Вам нужна внешняя проверка для этого человека.
Pinocchio 11 июнь 2017, в 00:33
0

Кто проверяет валидаторы? А кто смотрит на сторожей?
David Lemon 15 июнь 2017, в 09:02
0

Существует ли также регулярное выражение для проверки правильности регулярного выражения для проверки регулярного выражения? И есть ли регулярное выражение для проверки этого?
Aenadon 17 сен. 2017, в 14:42
2

Начало сильна с этим этим.
Gábor Imre 13 нояб. 2017, в 14:07
1

Это правильный ответ
Salman A 18 март 2018, в 19:15

Показать ещё 18 комментариев

Теги:

regex

8 ответов

227

Вряд ли.

Оцените его в try..catch или независимо от того, что предоставляет ваш язык.

Dan 05 окт. 2008, в 18:01

148

Это не очень предприимчиво с вашей стороны.
MusiGenesis 05 окт. 2008, в 17:31
112

Я думаю, что это гораздо лучшее решение, чем пытаться проверить его с помощью регулярных выражений ....
Mike Stone 05 окт. 2008, в 19:02
14

Это легко в PHP, например: $ valid = (@preg_match ($ regex, '')! == FALSE);
ColinM 06 дек. 2012, в 23:00
2

Или в Python: exec "try: re.match (regex, '') \ nexcept: print (1)"
Stian OK 04 март 2015, в 16:18
11

Это заставило меня пройти финальный проект компилятора за 5 минут
diegoaguilar 25 март 2015, в 06:19
2

В JavaScript используйте это: `` try {new RegExp (value); вернуть истину; } catch (e) {return false; } ``
Betty St 30 июль 2015, в 11:52
12

Это дает ответ на вопрос. Потому что вопрос - проблема XY. Конечно, реальный вопрос заключается в том, «как проверить правильность регулярного выражения».
Raedwald 30 июнь 2016, в 12:09
2

@Raedwald это может быть, но с другой стороны, это не может быть. Хороший ответ на проблему XY объясняет, почему X - плохая идея, и ОП действительно должен вместо этого делать Y. Этот очень краткий ответ не дает.
SQB 18 июль 2016, в 13:25

Показать ещё 6 комментариев

154

Нет, если вы строго говорите о регулярных выражениях и не включаете некоторые реализации регулярных выражений, которые на самом деле являются контекстно-свободными грамматиками.

Существует одно ограничение регулярных выражений, которое делает невозможным запись регулярного выражения, которое соответствует всем и только регулярным выражениям. Вы не можете сопоставлять реализации, например, фигурные скобки. Regexes использует много таких конструкций, поэтому возьмем [] в качестве примера. Всякий раз, когда есть [должно быть соответствие]. Достаточно просто для регулярного выражения "[. *]".

Что делает невозможным регулярное выражение, так это то, что они могут быть вложенными. Как вы можете написать регулярное выражение, соответствующее вложенным скобкам? Ответ: вы не можете без бесконечно длинного регулярного выражения. Вы можете сопоставить любое количество вложенных парсов с помощью грубой силы, но вы никогда не сможете сопоставить произвольно длинный набор вложенных скобок.

Эта способность часто упоминается как подсчет (вы считаете глубину вложенности). Регулярное выражение по определению не имеет возможности подсчитать.

EDIT: Закончилось писать сообщение в блоге об этом: Ограничения регулярного выражения

JaredPar 05 окт. 2008, в 18:22

2

Мне часто приходится различать общий инструмент сопоставления текста, называемый регулярным выражением, и регулярное выражение, на котором он основан. К сожалению, многие не видят различия. RE2 уникален тем, что допускает только расширение, которое может быть переведено обратно в обычный RE. Он также обладает всеми преимуществами RE (ограниченная память, время выполнения, скорость), с большинством синтаксических расширений.
deft_code 18 нояб. 2013, в 17:49
0

Почему регулярное выражение не может найти пары скобок? Я написал синтаксический анализатор моего собственного языка, и он может проверить, имеет ли каждая скобка подходящее окончание. Проверьте это: regex101.com/r/y4xhYo/1
RedClover 31 авг. 2017, в 14:49
0

печально, что принятый ответ имеет в 3 раза больше голосов, чем этот ..
Andre Figueiredo 17 янв. 2018, в 21:47
1

@ labela - gotoa Это пример среди "реализаций регулярных выражений, которые фактически являются контекстно-свободными грамматиками" (рекурсия, как вы использовали, дорогая и не допускается в регулярных выражениях vanilla)
Vitruvius 08 фев. 2018, в 10:02

Показать ещё 2 комментария

37

Хороший вопрос. Истинные регулярные языки не могут решить произвольно глубоко вложенные хорошо сформированные круглые скобки. То есть, если ваш алфавит содержит '(' и ')', цель состоит в том, чтобы решить, имеет ли строка из них хорошо сформированные соответствующие скобки. Так как это необходимое требование для регулярных выражений, то ответ - нет.

Однако: если вы отмените требование и добавите рекурсию, вы, вероятно, сможете это сделать. Причина в том, что рекурсия может действовать как "стек", позволяя вам "подсчитать" текущую глубину вложенности, нажав на этот стек.

Russ Cox написал замечательный трактат о реализации двигателя regex: Регуляция регулярных выражений может быть простой и быстрой

I GIVE CRAP ANSWERS 05 окт. 2008, в 19:30

0

В этой статье предполагается, что вам не нужны все расширения, которые предоставляют типичные движки регулярных выражений. В следующей статье обсуждается извлечение субматчей, но есть гораздо больше.
reinierpost 02 июнь 2016, в 09:25

7

Хотя вполне возможно использовать рекурсивное регулярное выражение, которое опубликовал MizardX, для такого рода вещей гораздо полезнее парсер. Regexes изначально предназначались для использования с обычными языками, будучи рекурсивными или имеющими балансировочные группы - это всего лишь патч.

Язык, который определяет действительные регулярные выражения, на самом деле является контекстно-свободной грамматикой, и вы должны использовать соответствующий синтаксический анализатор для его обработки. Ниже приведен пример университетского проекта для синтаксического анализа простых регулярных выражений (без большинства конструкций). Он использует JavaCC. И да, комментарии написаны на испанском языке, хотя имена методов довольно понятны.

SKIP :
{
    " "
|   "\r"
|   "\t"
|   "\n"
}
TOKEN : 
{
    < DIGITO: ["0" - "9"] >
|   < MAYUSCULA: ["A" - "Z"] >
|   < MINUSCULA: ["a" - "z"] >
|   < LAMBDA: "LAMBDA" >
|   < VACIO: "VACIO" >
}

IRegularExpression Expression() :
{
    IRegularExpression r; 
}
{
    r=Alternation() { return r; }
}

// Matchea disyunciones: ER | ER
IRegularExpression Alternation() :
{
    IRegularExpression r1 = null, r2 = null; 
}
{
    r1=Concatenation() ( "|" r2=Alternation() )?
    { 
        if (r2 == null) {
            return r1;
        } else {
            return createAlternation(r1,r2);
        } 
    }
}

// Matchea concatenaciones: ER.ER
IRegularExpression Concatenation() :
{
    IRegularExpression r1 = null, r2 = null; 
}
{
    r1=Repetition() ( "." r2=Repetition() { r1 = createConcatenation(r1,r2); } )*
    { return r1; }
}

// Matchea repeticiones: ER*
IRegularExpression Repetition() :
{
    IRegularExpression r; 
}
{
    r=Atom() ( "*" { r = createRepetition(r); } )*
    { return r; }
}

// Matchea regex atomicas: (ER), Terminal, Vacio, Lambda
IRegularExpression Atom() :
{
    String t;
    IRegularExpression r;
}
{
    ( "(" r=Expression() ")" {return r;}) 
    | t=Terminal() { return createTerminal(t); }
    | <LAMBDA> { return createLambda(); }
    | <VACIO> { return createEmpty(); }
}

// Matchea un terminal (digito o minuscula) y devuelve su valor
String Terminal() :
{
    Token t;
}
{
    ( t=<DIGITO> | t=<MINUSCULA> ) { return t.image; }
}

Santiago Palladino 06 окт. 2008, в 15:13

5

Будучи немного лучше, я согласен, что вы должны придерживаться одного языка. И, не говоря про-английский или «ваш язык отстой», Линус Торвальдс, по крайней мере, уже предлагает стандарт.
Chris Lutz 27 апр. 2009, в 16:42
20

Я согласен, что использование испанского, английского и Spanglish в одном и том же коде не является удачной практикой. Проблема в том, что я привык писать по-английски, но в проекте были некоторые рекомендации (например, комментирование на испанском или использование определенных имен для токенов). В любом случае, цель состояла в том, чтобы просто дать представление об алгоритме, а не дать полный справочный код.
Santiago Palladino 27 апр. 2009, в 17:29
0

В любом случае, большинство этих слов чрезвычайно похожи в обоих языках, поэтому я думаю, что если вы не совсем плотны, за ними должно быть легко следовать.
Casey 06 апр. 2015, в 16:04
3

Я не совсем согласен с "matchea" действительно испанским ... :-)
Gonmator 21 янв. 2016, в 15:14

Показать ещё 2 комментария

5

Вы можете отправить регулярное выражение в preg_match, которое вернет false, если регулярное выражение недействительно. Не забудьте использовать "@" для подавления сообщений об ошибках:

@preg_match($regexToTest, '');

вернет 1, если регулярное выражение равно //.
вернет 0, если регулярное выражение в порядке.
в противном случае возвращает false.

Richard - Rogue Wave Limited 28 авг. 2011, в 18:11

4

Этот пример в вики-каталоге pyparsing дает грамматику для разбора некоторых регулярных выражений с целью возврата набора совпадающих строк. Таким образом, он отвергает те, которые включают неограниченные термины повторения, такие как "+" и "*". Но это должно дать вам представление о том, как структурировать парсер, который будет обрабатывать re.

PaulMcG 25 май 2010, в 12:59

-2

Попробуйте этот...

//regular expression for email
    var pattern = /^(([^<>()[\]\\.,;:\s@\"]+(\.[^<>()[\]\\.,;:\s@\"]+)*)|(\".+\"))@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\])|(([a-zA-Z\-0-9]+\.)+[a-zA-Z]{2,}))$/;
    if(pattern.test(email)){
        return true;
    } else {
        return false;
    }

sumit kumar pradhan 05 март 2018, в 07:28

Ещё вопросы

Вышеупомянутое может или не может быть полезным на практике (я не рассмотрел их подробно, и при этом я не являюсь особенно хорошим судьей), но формально, языки регулярных выражений IIRC (по крайней мере некоторые) являются законченными по Тьюрингу, и как таковые это невозможно построить тестер, который будет правильно оценивать правильность всех возможных регулярных выражений на этих языках. См. Теорему Гёделя о неполноте и тезис Черча-Тьюринга.
Кто проверяет правильность регулярного выражения?
@Nico кто regexiet регулярное выражение?
Я видел регулярное выражение для разбора регулярных выражений в JavaScript в одном из выступлений Дугласа Крокфорда.
Итак, ваша проблема заключается в проверке регулярного выражения, вы выбрали регулярное выражение для его решения. Интересно, является ли свойство регулярного выражения увеличения числа задач аддитивным или мультипликативным? Такое ощущение, что 4 проблемы вместо 2 :)
Для регулярных выражений существует множество обозначений - некоторые функции и их написание являются общими для большинства, некоторые пишутся по-разному или доступны только в одной конкретной записи. Большинство этих нотаций не являются «регулярными» в смысле обычной грамматики - вам нужен контекстно-свободный синтаксический анализатор для обработки неограниченного вложения подвыражений - хотя многие современные нотации «регулярных выражений» имеют расширения, которые выходят за рамки исходного формального определения и может позволить их собственные нотации быть распознанными. В любом случае, почему бы просто не спросить свою библиотеку регулярных выражений, допустимо ли каждое регулярное выражение?
@Nico - это все регулярные выражения.
@Polynomial Конечно, "Quis testificari ipsos regexes?" было бы лучше.
Я только видел этот вопрос, но много лет назад я написал регулярное выражение Perl для проверки регулярных выражений Perl (а также для обнаружения «опасных» операций по удалению). Это было несколько длиннее, чем регулярное выражение в ответе Маркуса Жардеро! Я полагал, что это было полно в то время, но у меня не было никого другого, чтобы проверить это.
Я слышал, что вы любите регулярные выражения ...
@bevacqua Мне нужно проверить регулярное выражение в схеме XML. Как я могу сделать это без другого регулярного выражения?
Нет, нет; это создаст особенность в пространстве-времени, которая разрушит вселенную, какой мы ее знаем.
В некоторых случаях вы можете использовать сторонние сервисы, такие как онлайн-тестер и отладчик regex: regex101.com
Диктор: настройтесь на следующую неделю для ... "Есть ли регулярное выражение для определения допустимого сценария Perl?"
напоминает мне теоремы Гёделя о неполноте. Вы пытаетесь доказать, что вы совершенны, только глядя на себя в зеркало? Вам нужна внешняя проверка для этого человека.
Кто проверяет валидаторы? А кто смотрит на сторожей?
Существует ли также регулярное выражение для проверки правильности регулярного выражения для проверки регулярного выражения? И есть ли регулярное выражение для проверки этого?
Это не очень предприимчиво с вашей стороны.
Я думаю, что это гораздо лучшее решение, чем пытаться проверить его с помощью регулярных выражений ....
Это легко в PHP, например: $ valid = (@preg_match ($ regex, '')! == FALSE);
Или в Python: exec "try: re.match (regex, '') \ nexcept: print (1)"
Это заставило меня пройти финальный проект компилятора за 5 минут
В JavaScript используйте это: `` try {new RegExp (value); вернуть истину; } catch (e) {return false; } ``
Это дает ответ на вопрос. Потому что вопрос - проблема XY. Конечно, реальный вопрос заключается в том, «как проверить правильность регулярного выражения».
@Raedwald это может быть, но с другой стороны, это не может быть. Хороший ответ на проблему XY объясняет, почему X - плохая идея, и ОП действительно должен вместо этого делать Y. Этот очень краткий ответ не дает.
Мне часто приходится различать общий инструмент сопоставления текста, называемый регулярным выражением, и регулярное выражение, на котором он основан. К сожалению, многие не видят различия. RE2 уникален тем, что допускает только расширение, которое может быть переведено обратно в обычный RE. Он также обладает всеми преимуществами RE (ограниченная память, время выполнения, скорость), с большинством синтаксических расширений.
Почему регулярное выражение не может найти пары скобок? Я написал синтаксический анализатор моего собственного языка, и он может проверить, имеет ли каждая скобка подходящее окончание. Проверьте это: regex101.com/r/y4xhYo/1
печально, что принятый ответ имеет в 3 раза больше голосов, чем этот ..
@ labela - gotoa Это пример среди "реализаций регулярных выражений, которые фактически являются контекстно-свободными грамматиками" (рекурсия, как вы использовали, дорогая и не допускается в регулярных выражениях vanilla)
В этой статье предполагается, что вам не нужны все расширения, которые предоставляют типичные движки регулярных выражений. В следующей статье обсуждается извлечение субматчей, но есть гораздо больше.
Будучи немного лучше, я согласен, что вы должны придерживаться одного языка. И, не говоря про-английский или «ваш язык отстой», Линус Торвальдс, по крайней мере, уже предлагает стандарт.
Я согласен, что использование испанского, английского и Spanglish в одном и том же коде не является удачной практикой. Проблема в том, что я привык писать по-английски, но в проекте были некоторые рекомендации (например, комментирование на испанском или использование определенных имен для токенов). В любом случае, цель состояла в том, чтобы просто дать представление об алгоритме, а не дать полный справочный код.
В любом случае, большинство этих слов чрезвычайно похожи в обоих языках, поэтому я думаю, что если вы не совсем плотны, за ними должно быть легко следовать.
Я не совсем согласен с "matchea" действительно испанским ... :-)

Markus Jarderot · Accepted Answer · 2008-10-05T18-38-00.000Z

593

Лучший ответ

/
^                                             # start of string
(                                             # first group start
  (?:
    (?:[^?+*{}()[\]\\|]+                      # literals and ^, $
     | \\.                                    # escaped characters
     | \[ (?: \^?\\. | \^[^\\] | [^\\^] )     # character classes
          (?: [^\]\\]+ | \\. )* \]
     | \( (?:\?[:=!]|\?<[=!]|\?>)? (?1)?? \)  # parenthesis, with recursive content
     | \(\? (?:R|[+-]?\d+) \)                 # recursive matching
     )
    (?: (?:[?+*]|\{\d+(?:,\d*)?\}) [?+]? )?   # quantifiers
  | \|                                        # alternative
  )*                                          # repeat content
)                                             # end first group
$                                             # end of string
/

Это рекурсивное регулярное выражение и не поддерживается многими механизмами регулярных выражений. Основанные на PCRE должны поддерживать его.

Без пробелов и комментариев:

/^((?:(?:[^?+*{}()[\]\\|]+|\\.|\[(?:\^?\\.|\^[^\\]|[^\\^])(?:[^\]\\]+|\\.)*\]|\((?:\?[:=!]|\?<[=!]|\?>)?(?1)??\)|\(\?(?:R|[+-]?\d+)\))(?:(?:[?+*]|\{\d+(?:,\d*)?\})[?+]?)?|\|)*)$/

.NET не поддерживает рекурсию напрямую. (Конструкции (?1) и (?R).) Рекурсия должна быть преобразована в подсчет сбалансированных групп:

^                                         # start of string
(?:
  (?: [^?+*{}()[\]\\|]+                   # literals and ^, $
   | \\.                                  # escaped characters
   | \[ (?: \^?\\. | \^[^\\] | [^\\^] )   # character classes
        (?: [^\]\\]+ | \\. )* \]
   | \( (?:\?[:=!]
         | \?<[=!]
         | \?>
         | \?<[^\W\d]\w*>
         | \?'[^\W\d]\w*'
         )?                               # opening of group
     (?<N>)                               #   increment counter
   | \)                                   # closing of group
     (?<-N>)                              #   decrement counter
   )
  (?: (?:[?+*]|\{\d+(?:,\d*)?\}) [?+]? )? # quantifiers
| \|                                      # alternative
)*                                        # repeat content
$                                         # end of string
(?(N)(?!))                                # fail if counter is non-zero.

Уплотненный:

^(?:(?:[^?+*{}()[\]\\|]+|\\.|\[(?:\^?\\.|\^[^\\]|[^\\^])(?:[^\]\\]+|\\.)*\]|\((?:\?[:=!]|\?<[=!]|\?>|\?<[^\W\d]\w*>|\?'[^\W\d]\w*')?(?<N>)|\)(?<-N>))(?:(?:[?+*]|\{\d+(?:,\d*)?\})[?+]?)?|\|)*$(?(N)(?!))

Markus Jarderot 05 окт. 2008, в 18:38

0

Будет ли это проверять замены и переводы?
slashmais 05 окт. 2008, в 17:27
0

Он будет проверять только часть регулярных выражений с заменами и переводами. s / <эта часть> /.../
Markus Jarderot 05 окт. 2008, в 17:32
63

Голосование вниз. Теоретически невозможно сопоставить все действительные грамматики регулярных выражений с регулярными выражениями.
JaredPar 05 окт. 2008, в 18:02
98

JaredPar: Это возможно, если механизм регулярных выражений поддерживает рекурсию, такую как PCRE, но это больше нельзя назвать регулярными выражениями.
Markus Jarderot 05 окт. 2008, в 18:14
104

Действительно, «рекурсивное регулярное выражение» не является регулярным выражением. Но это часто принимаемое расширение для двигателей регулярных выражений ... Как ни странно, это расширенное регулярное выражение не соответствует расширенным регулярным выражениям: D
ephemient 06 окт. 2008, в 05:22
5

Если это рекурсивно, это не регулярное выражение.
Marcin 11 нояб. 2008, в 20:09
9

«Теоретически, теория и практика - это одно и то же. На практике это не так». Почти каждый, кто знает регулярные выражения, знает, что регулярные выражения не поддерживают рекурсию. Но PCRE и большинство других реализаций поддерживают гораздо больше, чем базовые регулярные выражения.
Markus Jarderot 15 нояб. 2008, в 22:31
0

Привет .... ТАК поздно здесь .. Я искал такой как этот .. Но используя это с сценарием оболочки в команде grep, он показывает мне некоторую ошибку .. grep: Недопустимое содержимое \ {\}. Не могли бы вы помочь, я делаю сценарий, который может grep кода базы, чтобы найти все файлы, которые содержат регулярные выражения ... Заранее спасибо ....
Xander 22 май 2012, в 04:34
5

@Xander Этот шаблон использует расширение, называемое рекурсивными регулярными выражениями. Это не поддерживается разновидностью регулярных выражений POSIX. Вы можете попробовать с ключом -P включить режим регулярных выражений PCRE. Если вам нужна дополнительная помощь, пожалуйста, задайте отдельный вопрос.
Markus Jarderot 22 май 2012, в 05:11
17

Это похоже на разбор HTML с помощью Regex. Само регулярное выражение "не является регулярным языком и, следовательно, не может быть проанализировано с помощью регулярного выражения ..."
quantum 18 июнь 2012, в 22:57
1

@xiaomao Это верно для классических регулярных выражений. В некоторых современных реализациях допускается рекурсия, что делает его языком без контекста, хотя это несколько многословно для этой задачи.
Markus Jarderot 19 июнь 2012, в 05:15
43

Ваше регулярное выражение проходит ваш тест регулярного выражения.
John K 17 окт. 2014, в 00:17
0

Я вижу, где вы подходите []()/\. и другие специальные символы регулярных выражений. Где вы разрешаете не специальные символы? Кажется, что это будет соответствовать ^(?:[\.]+)$ , Но не ^abcdefg$ . Это действительное регулярное выражение.
Justin Morgan 22 май 2015, в 19:39
1

@JustinMorgan [^?+*{}()[\]\\|] будет соответствовать любому отдельному символу, не являющемуся частью какой-либо другой конструкции. Это включает в себя как буквальный ( a - z ), а также некоторые специальные символы ( ^ , $ , . ).
Markus Jarderot 22 май 2015, в 22:45
0

Этот ответ отправляет людей в совершенно неверном направлении. Они никогда не должны использовать regEx для поиска регулярных выражений, потому что это не может работать правильно во всех случаях. Смотрите мой ответ добавлен.
vitaly-t 02 янв. 2016, в 18:07
0

По какой-то причине не работает в C #.
Neolisk 29 янв. 2016, в 16:26
4

@Neolisk .NET не поддерживает рекурсию напрямую. Он должен быть преобразован в сбалансированные группы. Я обновил ответ с версией .NET.
Markus Jarderot 29 янв. 2016, в 17:13
0

@MarkusJarderot: Теперь он компилируется и проходит мои основные тесты. Надеюсь, это работает с более сложными сценариями. Спасибо за обновление. Upvoted.
Neolisk 29 янв. 2016, в 17:31
0

.{,1} имеет себе равных. Изменить на ^((?:(?:[^?+*{}()[\]\\|]+|\\.|\[(?:\^?\\.|\^[^\\]|[^\\^])(?:[^\]\\]+|\\.)*\]|$(?:\?[:=!]|\?<[=!]|\?>)?(?1)??$|$\?(?:R|[+-]?\d+)$)(?:(?:[?+*]|\{\d*(?:,\d*)?\})[?+]?)?|\|)*)$ совпадений. ИЗМЕНИТЬ \d+ to \d*
yunzen 16 март 2017, в 11:34
0

Регулярное выражение по def не должно иметь рекурсии, по крайней мере, сказать что-то подобное в вашем ответе, ваш движок регулярных выражений, вероятно, "слишком мощный" и на самом деле не является движком регулярных выражений.
Charlie Parker 11 июнь 2017, в 00:34
0

Просто заметка, что вы забыли флаг х
RedClover 31 авг. 2017, в 14:54

Показать ещё 19 комментариев