Regex Совпадение всех символов между двумя строками

Question

Regex Совпадение всех символов между двумя строками

328

Пример: "Это просто простое предложение".

Я хочу сопоставить каждого символа между "Это" и "предложение". Разрывы строк следует игнорировать. Я не могу понять правильный синтаксис.

0xbadf00d 24 май 2011, в 12:57

Источник

10

Возможно, вы захотите указать, в какой среде вы используете Regex. Могут быть различия в зависимости от того, что именно вы подразумеваете под «игнорированием» разрывов строк.
Andrew Barber 24 май 2011, в 11:57

Теги:

regex

11 ответов

138

Требуется ленивый квантификатор

Воскрешая этот вопрос, потому что регулярное выражение в принятом ответе мне кажется не совсем правильным. Зачем? Поскольку

(?<=This is)(.*)(?=sentence)

будет соответствовать my first sentence. This is my second в This is my first sentence. This is my second sentence.

См. демонстрацию.

Вам нужен ленивый квантификатор между двумя поисковыми окнами. Добавление ? делает звезду ленивой.

Это соответствует тому, что вы хотите:

(?<=This is).*?(?=sentence)

См. демонстрацию. Я удалил группу захвата, которая не нужна.

Режим DOTALL для соответствия разрыву строк

Обратите внимание, что в демонстрации установлен режим "точка соответствует разрыву строки" (a.k.a.) dot-all (см. как включить DOTALL на разных языках). Во многих вариантах регулярных выражений вы можете установить его с помощью онлайн-модификатора (?s), превратив выражение в:

(?s)(?<=This is).*?(?=sentence)

Ссылка

zx81 20 май 2014, в 10:14

0

Вы правы насчет группы захвата. Не знаю, почему я это сделал. Но разница между .* .*? Также объясняется в моем ответе (абзац перед «Обновлением»). Поэтому я не думаю, что мой ответ неверен.
stema 20 май 2014, в 12:28
2

@stema Извините за придирки, пока я читал вчера некоторые из ваших ответов, это единственный, который заставил меня дергаться. :) Я смягчила первую строку с is incorrect чтобы doesn't seem quite correct to me ... Надеюсь, это не заставляет вас дергаться, возможно, просто разница в восприятии того, каким должно быть выражение для такого большого трафика. ,
zx81 20 май 2014, в 20:20

31

Попробуйте This is[\s\S]*sentence, работает в javascript

kaore 21 сен. 2011, в 20:21

0

как выполнить ленивый поиск таким образом?
AGamePlayer 03 нояб. 2015, в 16:52
3

@AwQiruiGuo так же, как и выше. [\s\S]*? (также называется: не жадный шаблон)
Blauhirn 09 апр. 2016, в 16:54

14

Это:

This is (.*?) sentence

работает в javascript.

Riyafa Abdul Hameed 09 апр. 2016, в 17:15

2

Вы можете показать пример кода в JS?
Pini Cheyni 26 окт. 2016, в 14:55
0

К сожалению, строка не совпадает с новыми строками.
538ROMEO 06 май 2018, в 16:03

13

используйте это: (?<=beginningstringname)(.*\n?)(?=endstringname)

vignesh 01 янв. 2013, в 18:47

0

Не знаю, почему все "за" проголосовали, это допускает разрывы строки 0-1, а разрыв строки должен быть непосредственно перед endstringname
OGHaza 22 нояб. 2013, в 11:46
0

Я нашел полезным удалить начало строк журнала (отметка времени и т. Д.). Я использовал новую строку для начальной строки и «at» для конечной строки.
Stan 18 янв. 2017, в 05:19

1

В случае, если кто-то ищет пример этого в контексте Jenkins. Он анализирует build.log и, если он находит совпадение, он завершает сборку с совпадением.

import java.util.regex.Matcher;
import java.util.regex.Pattern;

node{    
    stage("parse"){
        def file = readFile 'build.log'

        def regex = ~"(?s)(firstStringToUse(.*)secondStringToUse)"
        Matcher match = regex.matcher(file)
        match.find() {
            capturedText = match.group(1)
            error(capturedText)
        }
    }
}

Cephos 05 янв. 2018, в 21:12

1

Вы можете просто использовать это: \This is .*? \sentence

AnirbanDebnath 22 сен. 2016, в 15:30

0

Я попал сюда при поиске регулярного выражения для преобразования этого синтаксиса печати между print "string" в Python2 в старых сценариях с: print ("string") для Python3. Работает хорошо, в противном случае используйте 2to3.py для дополнительных преобразований. Вот мое решение для других:

Попробуйте это на Regexr.com (по какой-то причине не работает в NP++):

find:     (?<=print)( ')(.*)(')
replace: ('$2')

для переменных:

(?<=print)( )(.*)(\n)
('$2')\n

для метки и переменной:

(?<=print)( ')(.*)(',)(.*)(\n)
('$2',$4)\n

Как заменить всю строку "print" в Python2 на print ("string") для Python3?

alchemy 24 дек. 2018, в 23:24

0

для быстрого поиска в VIM вы можете использовать в приглашении Vim Control:/Это. *\_. * предложение

vins 04 июль 2018, в 12:22

0

Вот как я это сделал:
Для меня это было проще, чем пытаться выяснить, какое именно выражение необходимо.

int indexPictureData = result.IndexOf("-PictureData:");
int indexIdentity = result.IndexOf("-Identity:");
string returnValue = result.Remove(indexPictureData + 13);
returnValue = returnValue + " [bytecoderemoved] " + result.Remove(0, indexIdentity); '

Bbb 31 май 2018, в 21:27

0

Возвышенный текст 3x

В возвышенном тексте вы просто пишете два слова, которые вы хотите сохранить, например, в вашем случае это

"Это" и "предложение"

а ты пишешь. * между

т.е. This is.* sentence

и это должно сделать тебя хорошо

rsc05 13 фев. 2018, в 12:02

0

Не уверен, что вопрос в том, как это сделать в Sublime Text, но в основном работает в Sublime Text. Это не работает, когда случается разрыв строки между «Это» и «предложение». Кроме того, возвышенный текст также выбирает «Это» и «Предложение», а не только текст между этими двумя строками.
Dylan Kinnett 16 нояб. 2018, в 20:52

Ещё вопросы

Возможно, вы захотите указать, в какой среде вы используете Regex. Могут быть различия в зависимости от того, что именно вы подразумеваете под «игнорированием» разрывов строк.
Вы правы насчет группы захвата. Не знаю, почему я это сделал. Но разница между .* .*? Также объясняется в моем ответе (абзац перед «Обновлением»). Поэтому я не думаю, что мой ответ неверен.
@stema Извините за придирки, пока я читал вчера некоторые из ваших ответов, это единственный, который заставил меня дергаться. :) Я смягчила первую строку с is incorrect чтобы doesn't seem quite correct to me ... Надеюсь, это не заставляет вас дергаться, возможно, просто разница в восприятии того, каким должно быть выражение для такого большого трафика. ,
как выполнить ленивый поиск таким образом?
@AwQiruiGuo так же, как и выше. [\s\S]*? (также называется: не жадный шаблон)
Вы можете показать пример кода в JS?
К сожалению, строка не совпадает с новыми строками.
Не знаю, почему все "за" проголосовали, это допускает разрывы строки 0-1, а разрыв строки должен быть непосредственно перед endstringname
Я нашел полезным удалить начало строк журнала (отметка времени и т. Д.). Я использовал новую строку для начальной строки и «at» для конечной строки.
Не уверен, что вопрос в том, как это сделать в Sublime Text, но в основном работает в Sublime Text. Это не работает, когда случается разрыв строки между «Это» и «предложение». Кроме того, возвышенный текст также выбирает «Это» и «Предложение», а не только текст между этими двумя строками.

stema · Accepted Answer · 2011-05-24T12-44-00.000Z

438

Лучший ответ

Например

(?<=This is)(.*)(?=sentence)

Regexr

Я использовал lookbehind (?<=) и смотрю вперед (?=), чтобы "Это" и "предложение" не были включены в совпадение, но это зависит от вашего прецедента, вы также можете просто написать This is(.*)sentence.

Важно то, что вы активируете режим "dotall" вашего механизма регулярных выражений, чтобы . соответствовал новой строке. Но как вы это делаете, зависит от вашего двигателя регулярных выражений.

Следующее, если вы используете .* или .*?. Первый из них жадный и будет соответствовать последнему "предложению" в вашей строке, второй - ленив и будет соответствовать до следующего "предложения" в вашей строке.

Обновление

Regexr

This is(?s)(.*)sentence

Где (? s) включает модификатор dotall, делая . совпадающим с символами новой строки.

Обновление 2:

(?<=is \()(.*?)(?=\s*\))

соответствует вашему примеру "Это (простое) предложение". См. Здесь Regexr

stema 24 май 2011, в 12:44

1

Обычно встраивание (?s) работает.
tchrist 24 май 2011, в 12:13
0

@ tchrist, прости, мне пришлось это посмотреть. Я правильно понимаю, и This is(?s)(.*)sentence будет работать?
stema 24 май 2011, в 12:20
0

@stema: Да, это должно работать, чтобы включить режим «точка все» в большинстве библиотек регулярных выражений.
tchrist 24 май 2011, в 12:21
1

Это в основном решило мою проблему, но как мне включить символ пробела в свой шаблон? Я попробовал следующее: "(. *?) ())", Чтобы соответствовать ")" в конце последовательности, но это не сработало.
0xbadf00d 24 май 2011, в 14:09
0

@ FrEEzE2046 Я не понимаю, что ) ? Если вы хотите сопоставить скобку, вы должны избежать ее, \) будет соответствовать одной закрывающей скобке.
stema 24 май 2011, в 14:14
0

Извините, я действительно хочу вот что: "(. *? =) (" - Первое окончание "(" (открывающая скобка) последовательности. Сама скобка не должна быть включена в совпадение. Если это Возможно, я также хотел бы игнорировать каждый символ пробела между скобкой и остальной частью матча.
0xbadf00d 24 май 2011, в 14:22
0

@ FrEEzE2046 Is (.*?)\s*\( что вы имеете в виду? \s - это один пробел * означает как минимум 0 раз и \( открывающая скобка.
stema 24 май 2011, в 14:27
0

Это не должно быть частью матча. Разве ты не написал мне нужно использовать? = Чтобы сделать это? Пример строки: «Это (простое) предложение». Я хочу мач "есть". Я могу исключить «Это», но мне также нужно исключить и все остальное. В настоящее время я получаю "is (". Я использую следующее регулярное выражение: @ "(? <= This) (? S) (. *?) \ S * ("
0xbadf00d 24 май 2011, в 14:31
0

@ FrEEzE2046 (.*?)(?=\s*\()
stema 24 май 2011, в 14:33
0

Я обновил свой комментарий. РЕДАКТИРОВАТЬ: Ваше последнее выражение сделал работу. Теперь мне нужно избавиться от оставшегося пробела между «This» и «(» ... но их может быть больше одного (я хочу исключить все из них).
0xbadf00d 24 май 2011, в 14:34
0

@ FrEEzE2046, я обновил свой ответ.
stema 24 май 2011, в 20:26
21

Только одно замечание - regexr говорит теперь, что lookbehind не поддерживается в javascript
Kovo 14 апр. 2014, в 10:53
0

Я хочу найти, включая разрыв строки и возврат каретки ... как это сделать ..?
Mohasin Ali 23 апр. 2014, в 13:26
0

более подробный ответ приведен ниже stackoverflow.com/a/23756210/730
Keng 20 май 2014, в 12:22
0

@MohasinAli это командный переключатель. отличается для каждой реализации языка. см. ваши заметки Lang для деталей.
Keng 20 май 2014, в 12:25
0

Я могу ошибаться, но. * Не будет работать, если есть новая строка, которая не включает новые строки. По крайней мере, в JS developer.mozilla.org/ru/docs/Web/JavaScript/Guide/…
Rantiev 28 янв. 2016, в 10:24
0

@Rantiev, вы правы, по умолчанию '.' не совпадает с символами новой строки, но вы можете изменить это, используя точечный или однострочный режим, который я упоминаю в своем ответе. На большинстве языков. Но когда я правильно помню, вы снова правы, а не в JavaScript.
stema 28 янв. 2016, в 10:41
0

@stema Да, он работает с однострочным режимом флага "s" /.*/s также в js.
Rantiev 29 янв. 2016, в 17:13
0

Этот ответ выглядит устаревшим. Указанные ссылки имеют ошибки.
Manohar Reddy Poreddy 15 апр. 2018, в 11:10
0

Есть ли способ справиться с повторными случаями этого разделения в блоке текста? Например: «Это просто \ na простое предложение. Вот некоторые дополнительные вещи. Это просто \ na простое предложение. А вот еще несколько вещей. Это просто \ na простое предложение.». В настоящее время он соответствует всей строке, а не каждому экземпляру.
jzadra 06 июль 2018, в 13:47

Показать ещё 18 комментариев