regex — вопросы с ответами

5 ответов
Я пытаюсь прочитать CSV файл членов факультета. Моя цель - подсчитать частоту каждой стандартизованной степени (например, PhD, Md, JD и т.д.) В файле. Файл содержит различные варианты одинаковой степени (например, PhD, Ph.D и Phd). До сих пор я использовал .lower.split() для преобразования текста ...
string
expression
23 авг. 2018, в 08:50
2 ответа
Я построил такое регулярное выражение, следуя инструкциям #Create phone regex phoneRegex = re.compile(r'''( (\d{3}|\(\d{3}\))? # area code (\s|-|\.)? # separator (\d{3}) # first 3 digits (\s|-|\.) # separator (\d{4}) # last 4 digits (\s*(ext|x|ext.)\s*(\d{2,5}))? # ext...
23 авг. 2018, в 06:38
1 ответ
В настоящее время я работаю над сценарием, чтобы использовать сырые текстовые файлы, размещать их в правильных папках года на основе системы номеров версий и переименовывать их так, чтобы наши разработчики могли легко интегрировать их в наш продукт. Этот файл называется APR30CaseRVU-1Day.txt. Мне ...
python-os
23 авг. 2018, в 02:18
1 ответ
\(([^\\(\\)]+)\) Мое регулярное выражение захватывает все между каждым набором скобок формы (Hello OR there) AND (big AND wide AND world) я получил Hello OR there big AND wide AND world Но он падает, когда в скобках заключены скобки (Hello OR there AND messing(it)up) AND (big AND wide AND worl...
python-3.x
parentheses
22 авг. 2018, в 22:00
1 ответ
Я пытаюсь извлечь номера модели из очень грязного поля строки в пандах. Усложнение состоит в том, что эти серийные номера не только числовые, но иногда буквенно-цифровые. То, что я пытаюсь сделать, - создать группу захвата регулярных выражений/комбо, которая позволяет мне захватывать альфа-символы ...
pandas
22 авг. 2018, в 21:19
1 ответ
Я создал простой детектор признаков слова. До сих пор удалось найти конкретные функции (смешались внутри) строки, но алгоритм запутался с определенными последовательностями слов. Позвольте мне проиллюстрировать: from nltk.tokenize import word_tokenize negative_descriptors = ['no', 'unlikely', 'no e...
nltk
22 авг. 2018, в 21:18
1 ответ
Как удалить все после .rtf Что я до сих пор удаляет .rtf и все после него. s = 'newyork.pdf.rtf.doc' actual_file = re.sub(".rtf.+", "", s) возвращает newyork.pdf
22 авг. 2018, в 21:00
4 ответа
Я пытаюсь создать regex для ввода html5, который должен содержать только допустимое имя папки. Чтобы поддерживать большое количество файловых систем, я думал только о том, чтобы: Минимальная длина - 1 символ между aZ и 0-9 Во время средних пробелов допускается, но не в начале или в конце Разреш...
07 сен. 2017, в 23:03
2 ответа
У меня есть строка с несколькими вхождениями такого ключа var str = '[a] is a string with many [a] but only one [b]'; теперь у меня есть объект с ключами со значениями в str; var obj = {a:'the a',b:'the b'}; Я пробовал это, заменяя эти ключи своими значениями let output = str; for (const key in...
string
replace
07 сен. 2017, в 20:54
1 ответ
Рекомендуется ли использовать анкеры внутри групп захвата? Я пытаюсь имитировать работу lookbehind с этим шаблоном, чтобы соответствовать началу строки или пробелу. Например, чтобы соответствовать хэштегам, которые находятся в начале строки или после пробела И они закончат строку или после них буд...
capturing-group
lookbehind
07 сен. 2017, в 20:47
2 ответа
Я написал код проверки для имени, так что пользовательский ввод, такой как буквы и пробелы, и апострофы могут быть включены в поле формы имени: if (!preg_match("/^[a-zA-Z' ]*$/",$name)) { $name = ""; $nameErr = "Only letters and white space allowed"; } у меня тоже есть $name = mysqli_re...
05 янв. 2015, в 13:13
2 ответа
Я хочу выделить строку, т.е. комбинацию имени субъекта с тематическим кодом, на две части в java. Оригинальная строка может быть НИЧЕГО, как "ABC (01dfv)", "BCD (sdfsd) и т.д.) Код темы, всегда написанный в(), и имя объекта всегда будет префикс скобки. Пример: String originalString = "Computer Scie...
replaceall
25 май 2014, в 20:18
1 ответ
Я следил за этой ссылкой, и все было хорошо. Теперь я попытался разместить эту функцию rreplace в своей собственной библиотеке, как это содержание myLib.h #include <regex> using namespace std; class myLib { private: // Some private things public: // Some public th...
compiler-errors
21 дек. 2013, в 20:27
1 ответ
У меня есть эта структура для получения данных из другого webstie $searchURL = "http://www.anotherwebsite.com"; $html = file_get_contents($searchURL); $patternform = '/(<tbody.*<\/tbody>)/sm'; preg_match_all($patternform ,$html,$matches); preg echo $matches[0][0]; <tr class="even hi...
08 нояб. 2013, в 16:59
1 ответ
Я хочу заменить теги img в строке. Замена тега img и добавление, например, тега [href] отлично работает с парсером dom, но это не поможет мне, поскольку мне нужно изменить теги в существующей строке html. Я знаю, что изменение html с регулярным выражением - не очень хорошая идея, но я не могу понят...
dom
08 нояб. 2013, в 14:08
Наверх
Меню