Или условие для литеральной строки в выражении регулярного выражения

Question

Или условие для литеральной строки в выражении регулярного выражения

1

У меня есть следующее выражение регулярного выражения

re.findall('\(([0-9].*?)\)', a[a.find('('):].strip())

для строк, таких как

asdasdasd (21345-asdasdasd)

чтобы получить то, что находится внутри скобок, а затем число. Но я также хочу быть в состоянии получить то, что внутри, за которым следует строка "NA", например:

asdasdasd (NA-asdasdasd)

Я пробовал:

re.findall('\(([0-9].*?)\)|\((NA.*?)\)', a[a.find('('):].strip())

но создает кортеж. Как это будет? Заранее спасибо!

Solar 11 окт. 2018, в 13:51

Источник

1

Попробуйте \((?:\d|NA)[^()]*\)
revo 11 окт. 2018, в 11:39
0

Итак, удалите захватывающие скобки. Или используйте re.findall(r'\(((?:[0-9]+|NA)-[^)]*)\)', a)
Wiktor Stribiżew 11 окт. 2018, в 11:39
0

Здравствуйте @ WiktorStribiż, это сработало!
Solar 11 окт. 2018, в 11:43
0

Здравствуйте @revo, он тоже работает, но убирает круглые скобки, просто '(?:\d|NA)[^()]*'
Solar 11 окт. 2018, в 11:44
0

Да, но тогда он может совпадать с подобными подстроками, которые не заключены в скобки. Это зависит от того, что вы хотите.
revo 11 окт. 2018, в 11:45

Показать ещё 3 комментария

Теги:

python

regex

python-2.7

1 ответ

Ещё вопросы

Итак, удалите захватывающие скобки. Или используйте re.findall(r'\(((?:[0-9]+|NA)-[^)]*)\)', a)
Здравствуйте @ WiktorStribiż, это сработало!
Здравствуйте @revo, он тоже работает, но убирает круглые скобки, просто '(?:\d|NA)[^()]*'
Да, но тогда он может совпадать с подобными подстроками, которые не заключены в скобки. Это зависит от того, что вы хотите.

Wiktor Stribiżew · Answer 1 · 2018-10-11T09-38-00.000Z

Вы можете захватить подстроку между круглыми скобками, когда текст внутри начинается с цифр /NA за которыми следуют - и любых других символов, кроме ( и ) используя

re.findall(r'\(((?:[0-9]+|NA)-[^)]*)\)', a)

См. Демо-версию regex.

подробности

\( - a (
((?:[0-9]+|NA)-[^)]*) - Захват группы (это значение будет возвращено re.findall):
- (?:[0-9]+|NA) - 1 или более цифр или NA
- - - дефис
- [^)]* - 0+ символы кроме )
\) - a ) char.

См. Демонстрацию Python:

import re
strs = ['asdasdasd (21345-asdasdasd)', 'asdasdasd (NA-asdasdasd)']
for s in strs:
    print(re.findall(r'\(((?:[0-9]+|NA)-[^)]*)\)', s))

Выход:

['21345-asdasdasd']
['NA-asdasdasd']