Закончены ли регулярные выражения Perl?

Question

Закончены ли регулярные выражения Perl?

45

Я видел, как программисты Ruby и Perl выполняют некоторые сложные проблемы с кодом полностью с помощью регулярных выражений. Возможности lookahead и lookbehind в регулярных выражениях Perl делают их более мощными, чем реализации регулярных выражений на большинстве других языков. Мне было интересно, насколько они сильны на самом деле.

Есть ли простой способ доказать или опровергнуть, что регулярные выражения Perl Turing завершены?

Peter Olson 02 нояб. 2011, в 16:07

Источник

1

Смотрите также cstheory.stackexchange.com/questions/1047/…
kennytm 02 нояб. 2011, в 15:48
3

Ну, как обычно, есть (?{ code }) , так что да. Я не знаю ответа без различных экспериментальных функций code-in-regexp (исключение которых делает это нетривиальным), поэтому не оставляю ответа.
derobert 02 нояб. 2011, в 15:53
0

Для тех, кто голосует, чтобы закрыть как не по теме: эти вопросы тоже не по теме?
Peter Olson 02 нояб. 2011, в 16:10
0

@PeterOlson: Да, но их спросили еще до того, как появились программисты.
Daenyth 02 нояб. 2011, в 20:22
1

@daxim - Какие здесь правила? Вы можете легко написать шаблон для правила 110 (например, начать с '010' и шаблона s/(?:|(?<=0)(0)(?=0)|(?<=0)0(?=(1))|...|(?<=1)1(?=1)(?=1*(0))|^(?=(0))|(?<=(0))$)/$1/g - мне нужно больше думать, я думаю), но я думаю, что вы должны использовать его в цикле, чтобы иметь какое-либо применение. Это законно? Может быть, у вас есть шаблон программы, которую вы ищете?
Kobi 09 нояб. 2011, в 21:19
0

@ Коби Если он завершен, это законно. Я действительно не понимаю правило 110, поэтому я не знаю, работает ли это или нет.
Peter Olson 09 нояб. 2011, в 21:31
0

Коби, добавь это как сложный ответ; комментарии не имеют права на награды.
daxim 10 нояб. 2011, в 09:24

Показать ещё 5 комментариев

Теги:

regex

perl

turing-complete

3 ответа

16

Есть как минимум два обсуждения: полнота и регулярные выражения Тьюринга и Являются ли шаблоны Perl универсальными? с дальнейшие ссылки.

Консенсус (к моему неподготовленному глазу) кажется, что ответ "нет", но я не уверен, правильно ли я все понимаю.

Sinan Ünür 02 нояб. 2011, в 16:42

3

Для регулярных выражений в Perl существуют два случая:

Со встроенным кодом: они, конечно, завершают Turing.
Без встроенного кода: они всегда останавливаются, поэтому они не являются общими машинами Тьюринга.

Каждый обычный язык может быть принят конечным автоматом. Его ввод должен быть конечной строкой.

[...] a детерминированный конечный автомат (DFA), также известный как детерминированный конечный автомат - это машина конечного состояния, которая принимает/отклоняет конечные строки символов [...].

То же самое относится к машинам Тьюринга: формальное определение даже не имеет ввода. Он должен быть закодирован в конечном числе состояний.

Альтернативные (эквивалентные) определения включают ввод, но он должен быть конечным.

usr 17 дек. 2011, в 10:22

1

Будут ли они всегда останавливаться на произвольном вводе? Например, они не всегда останавливаются на бесконечно длинной цепочке.
Miles Rout 12 июнь 2014, в 15:11
0

@MilesRout Я не думаю, что бесконечный ввод разрешен или имеет смысл. Почти ничто не останавливается с бесконечным вводом. Даже (ab)* не останавливается, потому что всегда может быть c в будущем. Ответ из учебника таков: обычные языки явно не являются законченными по Тьюрингу. Я думаю, что бесконечный ввод просто не является частью определения.
usr 12 июнь 2014, в 15:24
1

(ab)* останавливается на бесконечном вводе, как abcabcabcabcabcabc...
Miles Rout 13 июнь 2014, в 03:45
0

Да, плохой пример. a*b не останавливается для ввода aaaaa... Во всяком случае, я не думаю, что бесконечные входы разрешены или имеют смысл. Это сделало бы недействительными многие важные и явно верные результаты.
usr 13 июнь 2014, в 10:58
0

Бесконечные входы определенно разрешены. У машин Тьюринга теоретически бесконечная лента, иначе они не способны вычислить все.
William Shipley 02 авг. 2014, в 06:01
2

@WilliamShipley бесконечная лента не означает бесконечный ввод. Еще раз обратите внимание, что любая машина иерархии Хомского не останавливается, если вы вводите в нее бесконечный ввод. Следовательно, должно быть невозможно обеспечить бесконечный ввод, чтобы заставить существующие определения работать.
usr 02 авг. 2014, в 09:35
0

Они всегда останавливаются, если рекурсивные? Думаю, нет.
Tuntable 08 авг. 2016, в 02:41
0

Вы понимаете (?R) не останавливается (и совместно). (ошибка выдается, но точка остается в силе ....)
Downgoat 09 фев. 2017, в 01:48
0

Я этого не осознавал. Тогда этот ответ неверен. @Downgoat
usr 09 фев. 2017, в 15:01
0

Регулярные выражения Perl не являются регулярными выражениями в значении термина CS, они могут анализировать языки, которые даже не являются контекстно-свободными.
saolof 19 сен. 2018, в 04:20

Показать ещё 8 комментариев

Ещё вопросы

Смотрите также cstheory.stackexchange.com/questions/1047/…
Ну, как обычно, есть (?{ code }) , так что да. Я не знаю ответа без различных экспериментальных функций code-in-regexp (исключение которых делает это нетривиальным), поэтому не оставляю ответа.
Для тех, кто голосует, чтобы закрыть как не по теме: эти вопросы тоже не по теме?
@PeterOlson: Да, но их спросили еще до того, как появились программисты.
@daxim - Какие здесь правила? Вы можете легко написать шаблон для правила 110 (например, начать с '010' и шаблона s/(?:|(?<=0)(0)(?=0)|(?<=0)0(?=(1))|...|(?<=1)1(?=1)(?=1*(0))|^(?=(0))|(?<=(0))$)/$1/g - мне нужно больше думать, я думаю), но я думаю, что вы должны использовать его в цикле, чтобы иметь какое-либо применение. Это законно? Может быть, у вас есть шаблон программы, которую вы ищете?
@ Коби Если он завершен, это законно. Я действительно не понимаю правило 110, поэтому я не знаю, работает ли это или нет.
Коби, добавь это как сложный ответ; комментарии не имеют права на награды.
Будут ли они всегда останавливаться на произвольном вводе? Например, они не всегда останавливаются на бесконечно длинной цепочке.
@MilesRout Я не думаю, что бесконечный ввод разрешен или имеет смысл. Почти ничто не останавливается с бесконечным вводом. Даже (ab)* не останавливается, потому что всегда может быть c в будущем. Ответ из учебника таков: обычные языки явно не являются законченными по Тьюрингу. Я думаю, что бесконечный ввод просто не является частью определения.
(ab)* останавливается на бесконечном вводе, как abcabcabcabcabcabc...
Да, плохой пример. a*b не останавливается для ввода aaaaa... Во всяком случае, я не думаю, что бесконечные входы разрешены или имеют смысл. Это сделало бы недействительными многие важные и явно верные результаты.
Бесконечные входы определенно разрешены. У машин Тьюринга теоретически бесконечная лента, иначе они не способны вычислить все.
@WilliamShipley бесконечная лента не означает бесконечный ввод. Еще раз обратите внимание, что любая машина иерархии Хомского не останавливается, если вы вводите в нее бесконечный ввод. Следовательно, должно быть невозможно обеспечить бесконечный ввод, чтобы заставить существующие определения работать.
Они всегда останавливаются, если рекурсивные? Думаю, нет.
Вы понимаете (?R) не останавливается (и совместно). (ошибка выдается, но точка остается в силе ....)
Я этого не осознавал. Тогда этот ответ неверен. @Downgoat
Регулярные выражения Perl не являются регулярными выражениями в значении термина CS, они могут анализировать языки, которые даже не являются контекстно-свободными.

frezik · Accepted Answer · 2011-11-02T21-20-00.000Z

За исключением любого встроенного кода, такого как ?{ }, они, вероятно, не охватывают все контекстно-свободные, а тем более Turing Machines. Они могут, но, насколько мне известно, никто так и не доказал это так или иначе. Учитывая, что люди некоторое время пытались решить некоторые проблемы, связанные с контекстом, с регулярными выражениями Perl и еще не придумали решение, вероятно, что они не являются контекстно-зависимыми.

Существует интересная дискуссия о том, какие функции просто удобны, и которые на самом деле добавляют силу. Например, сопоставление 0 ⁿ * 1 * 0 ⁿ (это обозначение для "любого числа нулей, за которым следует один, за которым следует такое же количество нулей, как и раньше" ) не является чем-то, что можно сделать с чистыми регулярными выражениями. Вы можете доказать, что это не может быть сделано с помощью регулярных выражений с использованием леммы накачки, но простое, неформальное доказательство состоит в том, что регулярное выражение должно было бы подсчитать произвольное количество нулей, а регулярные выражения не могут подсчитывать.

Однако обратные ссылки могут соответствовать таковым:

/(0*) 1 \1/x;

Итак, это означает, что обратные ссылки дают вам больше энергии и не просто удобство. Что еще может дать нам больше силы, интересно?

Кроме того, Perl6 "шаблоны" (они даже не притворяются, что они уже представляют собой регулярные выражения) предназначены для того, чтобы выглядеть похожими на Perl5 regexes (так что вам не нужно много переучивать), но у них достаточно дополнительных функций полностью контекстно-свободный. Они на самом деле разработаны так, что вы можете использовать их, чтобы изменить способ анализа в лексической области.

По-видимому, регулярные выражения по крайней мере более мощные, чем контекстно-свободные грамматики nikic.github.io/2012/06/15/…