Python - генерирует регистронезависимую REGEXP-подобную строку

Question

Python - генерирует регистронезависимую REGEXP-подобную строку

1

Как я могу автогенерировать регистр REGEXP без учета регистра для строки, которая может иметь следующий вариант: 'ENTI', 'Enti'

Я получил это до сих пор, но он выглядит неуклюжим,

entity_type = 'Enti'
prefix = 'E'
for char in entity_type[1:]:                          
    logs_prefix += '[' + char.upper() + char.lower() + ']'
print logs_prefix

>>>'E[Nn][Tt][Yy]'

Моя цель - сначала открыть список активных журналов (повернутые будут заканчиваться временной меткой), которые начинаются с заданной нечувствительной к регистру последовательности, поэтому я могу

regexp_filters = logs_prefix + '_A.out'
command = "ssh %(user)s@%(ip)s 'cd %(source_path)s; ls -t %(regexp_filters)s'" % locals()

и генерировать разные выражения rsync для ряда хостов. Игнорировать исключение, его из нескольких --excludes toolder, разбил журналы "* _A.out"

sync = "rsync -e ssh -a %(remote_rsync_binary)s --compress=9 -pgtov %(excluded_expression)s %(filters_expression)s --exclude='*' %s(user)@%(ip)s:%(source_path)s%(file_filter)s %(target_path)s" % locals()

Незначительный вопрос, как легко заключить строку /char с другими символами, в этом случае: [char]

РЕДАКТИРОВАТЬ: Нашел более чистый раствор, есть ли лучший способ?

for char in entity_type[1:]:
    prefix += "[%s]" % "%s%s" % (char.upper(), char.lower() )

EDIT2: (улучшение) как писал @eyquem,

prefix + ''.join( "[%s%s]" % (char.upper(), char.lower() for char in entity_type[1:])

Joao Figueiredo 10 май 2011, в 20:52

Источник

1

Ты не можешь просто проигнорировать дело?
nevets1219 10 май 2011, в 18:32
0

Нет. Цель состоит в том, чтобы автоматически обнаружить журналы, которые соответствуют заданному шаблону в удаленном пути (есть некоторые варианты), сгенерировать строку REGEX и передать ее команде rsync.
Joao Figueiredo 10 май 2011, в 18:35
1

Может быть, вы должны опубликовать также данные, которые у вас есть вместе с ожидаемым результатом
schoetbi 10 май 2011, в 18:36
2

@stack_zen "[%s]" % "%s%s" % (char.upper(), char.lower() ) равен "[%s%s]" % (char.upper(), char.lower()) Я думаю
eyquem 10 май 2011, в 22:31
2

@stack_zen И ваша правка может быть написана лучше: prefix + ''.join( "[%s%s]" % (char.upper(), char.lower() for char in entity_type[1:])
eyquem 10 май 2011, в 22:33
0

@stack_zen Кстати, шаблон 'E [nN] [tT] [iI]' не совпадает с шаблоном 'Enti | ENTI'
eyquem 10 май 2011, в 22:35
0

Спасибо @eyquem. Я проголосовал за оба комментария, относительно первого, я излишне оставил его в этой форме, потому что сначала я безуспешно пытался использовать его как "[% (char.upper ()) s% (char.lower ()) s) "% localals () Я отредактировал его, используя ваш второй совет, спасибо.
Joao Figueiredo 12 май 2011, в 22:45
0

Эти шаблоны соответствуют конечно :)
Joao Figueiredo 12 май 2011, в 22:54

Показать ещё 6 комментариев

Теги:

python

regex

for-loop

3 ответа

1

Вы можете попробовать это (Python 2.7.1):

>>> def goofy_regexp(s):
      return '{}|{}'.format(s.upper(), s.title())

>>> goofy_regexp('enti')
'ENTI|Enti'

Здесь версия 2.6 с форматированием строки старого стиля:

>>> def goofy_regexp26(s):
    return '%s|%s' % (s.upper(), s.title())

>>> goofy_regexp26('enti')
'ENTI|Enti'

John Gaines Jr. 10 май 2011, в 16:37

0

AttributeError: у объекта 'str' нет атрибута 'format' Это в Python 2.7 / 3.0+?
Joao Figueiredo 10 май 2011, в 18:56
0

stack_zen: Да.
Tim Pietzcker 10 май 2011, в 19:39

0

Я не могу поверить, что python фактически не поддерживает ignorecase в регулярном выражении. Просто передача "Ignorecase" в качестве флага для парсера регулярных выражений не лучше, чем выполнение upper() после факта и бесполезно для определения регулярного выражения case-insenstive

fijiaaron 04 фев. 2012, в 12:15

Ещё вопросы

Ты не можешь просто проигнорировать дело?
Нет. Цель состоит в том, чтобы автоматически обнаружить журналы, которые соответствуют заданному шаблону в удаленном пути (есть некоторые варианты), сгенерировать строку REGEX и передать ее команде rsync.
Может быть, вы должны опубликовать также данные, которые у вас есть вместе с ожидаемым результатом
@stack_zen "[%s]" % "%s%s" % (char.upper(), char.lower() ) равен "[%s%s]" % (char.upper(), char.lower()) Я думаю
@stack_zen И ваша правка может быть написана лучше: prefix + ''.join( "[%s%s]" % (char.upper(), char.lower() for char in entity_type[1:])
@stack_zen Кстати, шаблон 'E [nN] [tT] [iI]' не совпадает с шаблоном 'Enti | ENTI'
Спасибо @eyquem. Я проголосовал за оба комментария, относительно первого, я излишне оставил его в этой форме, потому что сначала я безуспешно пытался использовать его как "[% (char.upper ()) s% (char.lower ()) s) "% localals () Я отредактировал его, используя ваш второй совет, спасибо.
Эти шаблоны соответствуют конечно :)
AttributeError: у объекта 'str' нет атрибута 'format' Это в Python 2.7 / 3.0+?

schoetbi · Accepted Answer · 2011-05-10T16-59-00.000Z

Попробуйте следующее:

reEnti = re.compile('ent[iy]',re.IGNORECASE)

Это будет делать, если целью было проанализировать диапазон объектов с помощью Python, мне нужно сгенерировать строку, которая будет использоваться в качестве REGEXP внешней командой.