Регулярные выражения соответствуют чему-либо задом наперед до первого появления строки

Question

Регулярные выражения соответствуют чему-либо задом наперед до первого появления строки

1

Я разбираю файл журнала, подобный приведенному ниже, чтобы извлечь некоторую информацию, поэтому мне нужно сопоставить журнал TO_BE_MATCHED со всеми журналами до него до Tick2, но, к сожалению, он распространяется на отметку 1, несмотря на то, что я (?) Не жадный.

любые предложения здесь?

import re
if __name__ == "__main__":

    text_str ='''0000 :TRACE|####### Tick1 #######   | file1.c:604
    0001 :TRACE|log1                     | file2.c:400
    0002 :TRACE|log2                     | file3.c:611
    0003 :TRACE|####### Tick2 #######    | file1.c:604
    0004 :TRACE|log3                     | file2.c:498
    0005 :TRACE|log4                     | file3.c:676
    0006 :TRACE|TO_BE_MATCHED            | file4.c:555
    0007 :TRACE|log5                     | file5.c:676
    0008 :TRACE|####### Tick3 #######    | file1.c:604"'''

    regex = r"(Tick(\d+)(.*?)TO_BE_MATCHED)"

    match = re.findall(regex,str(text_str), re.DOTALL)

    if(match):
        print match[0][0]

===============================================

выход:

Tick1 #######   | file1.c:604
0001 :TRACE|log1                     | file2.c:400
0002 :TRACE|log2                     | file3.c:611
0003 :TRACE|####### Tick2 #######    | file1.c:604
0004 :TRACE|log3                     | file2.c:498
0005 :TRACE|log4                     | file3.c:676
0006 :TRACE|TO_BE_MATCHED

Asmaa 25 авг. 2018, в 11:43

Источник

0

Поставьте .* Перед тем, как потреблять и использовать группы для извлечения:. .*(Tick\d+.*?TO_BE_MATCHED)
bobble bubble 25 авг. 2018, в 11:20

Теги:

python

regex

2 ответа

1

regex = r"(Tick2(.*?)TO_BE_MATCHED)"

и если вы пытаетесь сопоставить все между TO_BE_MATCHED и TickN, где N - любое число, большее 2; затем

regex = "r(Tick[2-9]{1,}(.*)TO_BE_MATCHED)"

7kemZmani 25 авг. 2018, в 08:10

0

Ты это пробовал? Первый работает для Tick2 или Tick2315 но не для других значений.
Toto 25 авг. 2018, в 12:04
0

На самом деле, мне нужно извлечь число (2), которое напоминает номер тика, где появилась строка TO_BE_MATCHED.
Asmaa 25 авг. 2018, в 12:54
0

@ 7kemZmani Спасибо за вашу помощь, я ценю вашу инициативу, я обязательно добавлю эффективные детали для дальнейших вопросов, однако я уже принял первый ответ, который решает мою проблему независимо от баллов ... Спасибо всем, Удачи !
Asmaa 26 авг. 2018, в 08:21
0

Это не работает, если у вас есть, например, Tick2 Blah ... Tick3 Blah ... Tick4 ... TO_BE_MATCH
Toto 26 авг. 2018, в 09:16

Показать ещё 2 комментария

Ещё вопросы

Поставьте .* Перед тем, как потреблять и использовать группы для извлечения:. .*(Tick\d+.*?TO_BE_MATCHED)
Ты это пробовал? Первый работает для Tick2 или Tick2315 но не для других значений.
На самом деле, мне нужно извлечь число (2), которое напоминает номер тика, где появилась строка TO_BE_MATCHED.
@ 7kemZmani Спасибо за вашу помощь, я ценю вашу инициативу, я обязательно добавлю эффективные детали для дальнейших вопросов, однако я уже принял первый ответ, который решает мою проблему независимо от баллов ... Спасибо всем, Удачи !
Это не работает, если у вас есть, например, Tick2 Blah ... Tick3 Blah ... Tick4 ... TO_BE_MATCH

Toto · Accepted Answer · 2018-08-25T09-17-00.000Z

Этот будет выполнять эту работу, он соответствует всем Tick\d+ между Tick\d+ Tick\d и TO BE MATCHED, если между ними нет Tick\d+:

import re
if __name__ == "__main__":

    text_str ='''0000 :TRACE|####### Tick1 #######   | file1.c:604
    0001 :TRACE|log1                     | file2.c:400
    0002 :TRACE|log2                     | file3.c:611
    0003 :TRACE|####### Tick2 #######    | file1.c:604
    0004 :TRACE|log3                     | file2.c:498
    0005 :TRACE|log4                     | file3.c:676
    0006 :TRACE|TO_BE_MATCHED            | file4.c:555
    0007 :TRACE|log5                     | file5.c:676
    0008 :TRACE|####### Tick3 #######    | file1.c:604"'''

    regex = r"(Tick\d+((?!Tick\d+).)*TO_BE_MATCHED)"

    match = re.findall(regex,str(text_str), re.DOTALL)

    if(match):
        print match[0][0]

Спасибо! это решило мою проблему, вы указали мне, как правильно использовать отрицательное прогнозное утверждение (?!)