Как сделать регулярное выражение заменить в MySQL?

Question

Как сделать регулярное выражение заменить в MySQL?

472

У меня есть таблица с ~ 500 тыс. строк; varchar (255) столбец UTF8 filename содержит имя файла;

Я пытаюсь вычеркнуть различные странные символы из имени файла - подумал, что я бы использовал класс символов: [^a-zA-Z0-9()_ .\-]

Теперь есть функция в MySQL, которая позволяет вам заменять регулярное выражение? Я ищу аналогичную функциональность для функции REPLACE() - упрощен пример:

SELECT REPLACE('stackowerflow', 'ower', 'over');

Output: "stackoverflow"

/* does something like this exist? */
SELECT X_REG_REPLACE('Stackoverflow','/[A-Zf]/','-'); 

Output: "-tackover-low"

Я знаю REGEXP/RLIKE, но они проверяют, есть ли совпадение, а не то, что соответствует.

(я мог бы сделать "SELECT pkey_id,filename FROM foo WHERE filename RLIKE '[^a-zA-Z0-9()_ .\-]'" из PHP script, сделать preg_replace, а затем "UPDATE foo ... WHERE pkey_id=...", но это выглядит как медленный и уродливый взломать последний курорт)

Piskvor 12 июнь 2009, в 15:28

Источник

7

Это запрос функции с 2007 года: bugs.mysql.com/bug.php?id=27389 . Если вы действительно хотите эту функцию, войдите в систему и нажмите кнопку «Влияет на меня». Надеюсь, он получит достаточно голосов.
TMS 07 март 2014, в 17:19
4

@ Томас: Я сделал это ... в 2009 году, когда я искал это. Поскольку прогресс в этом направлении был нулевым - очевидно, это не такая важная особенность. (кстати, у Postgres это есть: stackoverflow.com/questions/11722995/… )
Piskvor 09 март 2014, в 16:45
1

Связанная, более простая версия этого вопроса: stackoverflow.com/questions/6942973/…
Kzqai 12 март 2014, в 21:30
1

@Kzqai: Полезно знать, спасибо; Я отредактирую это в вопросе.
Piskvor 14 март 2014, в 09:49
2

Я создал regexp_split (функция + процедура) и regexp_replace , которые реализованы с помощью REGEXP . Для простых поисков это сделает свое дело. Вы можете найти это здесь - так, это путь с хранимым кодом MySQL, без UDF. Если вы обнаружите некоторые ошибки, на которые не распространяются известные ограничения - не стесняйтесь открывать проблему.
Alma Do 05 июнь 2014, в 08:51
0

IMO, выбор, использование PHP, а затем обновление mysql - не такой уж плохой взлом. Я предпочитаю использовать нативные методы MySQL, когда это возможно - предположительно, это быстрее. Но у меня есть система, которая использует много PHP, и она делает сотни тысяч таких замен за несколько секунд (система, которую я построил, предназначена именно для такой работы).
Buttle Butkus 13 окт. 2016, в 01:53
0

Нашел эту библиотеку из другого потока SO: github.com/mysqludf/lib_mysqludf_preg работает отлично.
Kyle 27 нояб. 2017, в 22:14

Показать ещё 5 комментариев

Теги:

mysql

regex

mysql-udf

11 ответов

137

Нет.

Но если у вас есть доступ к вашему серверу, вы можете использовать пользовательскую функцию (UDF), такую как mysql-udf-regexp.

РЕДАКТИРОВАТЬ: MySQL 8. 0+ вы можете использовать изначально REGEXP_REPLACE. Больше в ответе выше

Jeremy Stein 12 июнь 2009, в 15:53

3

REGEXP_REPLACE как пользовательская функция? Выглядит многообещающе, посмотрю на это. Спасибо!
Piskvor 12 июнь 2009, в 15:34
1

Mysql не имеет этой встроенной функции. Мне сказали, что у Oracle это есть (но вам не поможет)
Lathan 26 июль 2010, в 14:08
14

К сожалению, mysql-udf-regexp не поддерживает многобайтовые символы. regexp_replace ('äöõü', 'ä', '') возвращает длинную числовую строку вместо реального текста.
lkraav 20 фев. 2012, в 01:44
1

@lkraav Правда? эта вещь звучит как утечка безопасности, так как эта "длинная числовая строка" выглядит как переполнение буфера.
Earth Engine 01 март 2013, в 00:48
1

Ну, это было год назад, но я почти уверен, что правильно определил проблему в то время. Понятия не имею, добились ли они какого-либо прогресса, так как я не касался этого инструмента с тех пор.
lkraav 01 март 2013, в 00:51
3

Сам MySQL не поддерживает многобайтовые символы с его функциями RegEx.
Brad 20 март 2013, в 20:53
4

Пользователи Windows: библиотека UDF, связанная здесь, похоже, не имеет хорошей поддержки Windows. Описанный метод установки Windows не работает для меня.
Jonathan 05 дек. 2013, в 23:58
2

@lkraav, попробуйте библиотеку lib_mysqludf_preg ниже, так как она прекрасно работает. Это подробная версия, так как она возвращает BLOB-объект по умолчанию, и я не знаю, есть ли у вас многобайтовая кодировка по умолчанию: выберите cast (TR as char) COLLATE utf8_unicode_ci from (выберите preg_replace ('/ ä /', '', 'öõüä') R) T
gillyspy 09 фев. 2014, в 19:46

Показать ещё 6 комментариев

118

Вместо этого используйте MariaDB. Он имеет функцию

REGEXP_REPLACE(col, regexp, replace)

См. Документы MariaDB и Улучшения регулярного выражения PCRE

Обратите внимание, что вы также можете использовать группировку regexp (я нашел это очень полезным):

SELECT REGEXP_REPLACE("stackoverflow", "(stack)(over)(flow)", '\\2 - \\1 - \\3')

возвращает

over - stack - flow

Benvorth 03 окт. 2014, в 13:39

4

Niiiice! Тем более, что мы уже перешли на него по несвязанным причинам. Спасибо за чаевые :)
Piskvor 03 окт. 2014, в 14:09
11

это из Мариадб 10
Nick 07 окт. 2014, в 17:02
1

Бенни - спасибо за то, что указал на это, но я немного запутался в фактической реализации ... не возражаешь по поводу моего вопроса здесь? stackoverflow.com/questions/27498929/… cc @Piskvor
Jeff Widman 16 дек. 2014, в 07:29
5

В следующий раз, когда мне это понадобится, вот синтаксис для изменения целого столбца: UPDATE table SET Name = REGEXP_REPLACE(Name, "-2$", "\\1") Это удаляет -2 из abcxyz-2 из целого столбца в один раз.
Josiah 11 авг. 2016, в 12:01
8

Изменение всей платформы вряд ли является реалистичным решением.
David Baucum 29 нояб. 2017, в 22:15
2

@DavidBaucum MariaDB представляет собой замену MySQL. Так что это не «смена платформы», а скорее выбор другой авиакомпании для той же поездки
Benvorth 30 нояб. 2017, в 06:15
2

@ Benvorth MySQL 8.0 тоже поддерживает это .
Lukasz Szozda 19 апр. 2018, в 16:10

Показать ещё 5 комментариев

100

Мой метод грубой силы, чтобы заставить это работать, было просто:

Дамп таблицы - mysqldump -u user -p database table > dump.sql
Найдите и замените пару шаблонов - find/path/to/dump.sql -type f -exec sed -i 's/old_string/new_string/g' {} \; , Есть, очевидно, другие выражения perl regeular, которые вы могли бы выполнить и в файле.
Импортировать таблицу - mysqlimport -u user -p database table < dump.sql

Если вы хотите убедиться, что строка не находится в другом месте вашего набора данных, запустите несколько регулярных выражений, чтобы убедиться, что все они встречаются в подобной среде. Также не сложно создать резервную копию, прежде чем запускать замену, если вы случайно уничтожили что-то, что теряет глубину информации.

Ryan Ward 26 фев. 2012, в 20:12

28

Хорошо, это тоже должно сработать; Я не рассматривал автономную замену. Хорошие нестандартные мысли там!
Piskvor 27 фев. 2012, в 05:33
10

Мне кажется странным, что вы использовали бы поиск таким образом, я бы сократил команду до sed -i 's / old_string / new_string / g' /path/to/dump.sql
speshak 23 март 2012, в 16:17
2

может работать, если замена не может сломать сам SQL.
Moshe L 04 май 2012, в 09:28
32

Очень рискованно и непрактично с большими наборами данных или с сохранением ссылочной целостности: для удаления данных и их последующей вставки вам придется отключить ссылочную целостность, на практике также отключив базу данных.
Raul Luna 15 май 2014, в 15:50
5

Использовав этот метод в прошлом, я согласен с Раулем, это очень рискованно. Вы также должны быть абсолютно уверены, что ваша строка не находится в вашем наборе данных.
eggmatters 09 июнь 2015, в 16:56
1

Несколько лет спустя до ответа @speshak, но причина, по которой я выбрал такой файл, была в том, что я изначально очень нервничал по тем же причинам, что были упомянуты выше. В то время казалось, что отделение части «найти файл» от части «замена» облегчит чтение кода до его отправки.
Ryan Ward 19 апр. 2018, в 22:38
0

Еще одно подтверждение: мне понравился этот метод, пока я не начал получать ошибки о количестве столбцов, не обрабатывающих ожидаемое значение (= сломал всю базу данных / таблицу).
CharlesM 23 авг. 2018, в 09:36

Показать ещё 5 комментариев

39

Недавно я написал функцию MySQL для замены строк с использованием регулярных выражений. Вы можете найти мой пост в следующем месте:

http://techras.wordpress.com/2011/06/02/regex-replace-for-mysql/

Вот код функции:

DELIMITER $$

CREATE FUNCTION  `regex_replace`(pattern VARCHAR(1000),replacement VARCHAR(1000),original VARCHAR(1000))
RETURNS VARCHAR(1000)
DETERMINISTIC
BEGIN 
 DECLARE temp VARCHAR(1000); 
 DECLARE ch VARCHAR(1); 
 DECLARE i INT;
 SET i = 1;
 SET temp = '';
 IF original REGEXP pattern THEN 
  loop_label: LOOP 
   IF i>CHAR_LENGTH(original) THEN
    LEAVE loop_label;  
   END IF;
   SET ch = SUBSTRING(original,i,1);
   IF NOT ch REGEXP pattern THEN
    SET temp = CONCAT(temp,ch);
   ELSE
    SET temp = CONCAT(temp,replacement);
   END IF;
   SET i=i+1;
  END LOOP;
 ELSE
  SET temp = original;
 END IF;
 RETURN temp;
END$$

DELIMITER ;

Пример выполнения:

mysql> select regex_replace('[^a-zA-Z0-9\-]','','2my test3_text-to. check \\ my- sql (regular) ,expressions ._,');

rasika godawatte 02 июнь 2011, в 15:53

7

Это также работает только на отдельных персонажей ..
Jay Taylor 05 янв. 2012, в 21:24
20

Я только подчеркну вышеупомянутый пункт: эта функция заменяет символы, которые соответствуют однозначному выражению. Выше сказано, что он используется «для переотображения строк с помощью регулярных выражений», и это может быть немного обманчивым. Это делает свою работу, но это не та работа, о которой просят. (Не жалоба - это просто чтобы спасти людей на неверный путь)
Jason 06 фев. 2012, в 23:15
2

Было бы более полезно включить код в ваш ответ, а не размещать голую ссылку.
phobie 17 нояб. 2015, в 09:38
2

select regex_replace('.*(abc).*','\1','noabcde') но, к сожалению, не работает со ссылками, такими как select regex_replace('.*(abc).*','\1','noabcde') (возвращает 'noabcde', а не 'abc').
Izzy 02 апр. 2016, в 18:33
0

@phobie кто-то другой сделал это в этом ответе - просто как ссылка на случай, если ссылка умрет;)
Izzy 02 апр. 2016, в 18:35
0

Я изменил этот метод, чтобы попытаться устранить некоторые из упомянутых выше ограничений и многое другое. Пожалуйста, посмотрите этот ответ .
Steve Chambers 01 авг. 2016, в 16:02

Показать ещё 4 комментария

33

мы решаем эту проблему без использования регулярного выражения этот запрос заменяет только точную строку соответствия.

update employee set
employee_firstname = 
trim(REPLACE(concat(" ",employee_firstname," "),' jay ',' abc '))

Пример:

emp_id employee_firstname

1 jay

2 jay ajay

3 jay

После выполнения результата запроса:

emp_id employee_firstname

1 abc

2 abc ajay

3 abc

Jay Patel 19 дек. 2014, в 05:36

4

Я понятия не имею, почему у этого ответа не было голосов, но это работает отлично.
James Drummond 25 дек. 2015, в 13:53
0

@yellowmelon для чего нужны две пары двойных кавычек?
codecowboy 04 март 2016, в 12:31
3

Он дополняет имя сотрудника пробелами до и после. Это позволяет ему искать и заменять (пробел) имя_служащего (пробел), что позволяет избежать перехвата имя_служащего "jay", если оно входит в большую строку "ajay". Затем он обрезает пробелы, когда закончите.
Slam 21 апр. 2016, в 20:29
1

Похоже, довольно солидный обходной путь для замены слов!
Sean the Bean 05 окт. 2017, в 13:32

Показать ещё 2 комментария

14

Я рад сообщить, что, поскольку этот вопрос был задан, теперь есть удовлетворительный ответ! Взгляните на этот потрясающий пакет:

https://github.com/mysqludf/lib_mysqludf_preg

Пример SQL:

SELECT PREG_REPLACE('/(.*?)(fox)/' , 'dog' , 'the quick brown fox' ) AS demo;

Я нашел пакет этот пост в блоге, связанный на этот вопрос.

dotancohen 13 нояб. 2013, в 16:21

1

Как бы вы обновили значение в таблице?
codecowboy 04 март 2016, в 12:29
0

@dotancohen, это тоже мой вопрос!
kidata 18 окт. 2016, в 09:31

8

ОБНОВЛЕНИЕ 2: полезный набор функций регулярных выражений, включая REGEXP_REPLACE, теперь представлен в MySQL 8.0. Это делает чтение ненужным, если вы не ограничены использованием более ранней версии.

ОБНОВЛЕНИЕ 1: Теперь превратили это в сообщение в блоге: http://stevettt.blogspot.co.uk/2018/02/a-mysql-regular-expression-replace.html

Следующее расширяет функции, предоставляемые Rasika Godawatte, но обходит все необходимые подстроки, а не просто проверяет отдельные символы:

-- ------------------------------------------------------------------------------------
-- USAGE
-- ------------------------------------------------------------------------------------
-- SELECT reg_replace(<subject>,
--                    <pattern>,
--                    <replacement>,
--                    <greedy>,
--                    <minMatchLen>,
--                    <maxMatchLen>);
-- where:
-- <subject> is the string to look in for doing the replacements
-- <pattern> is the regular expression to match against
-- <replacement> is the replacement string
-- <greedy> is TRUE for greedy matching or FALSE for non-greedy matching
-- <minMatchLen> specifies the minimum match length
-- <maxMatchLen> specifies the maximum match length
-- (minMatchLen and maxMatchLen are used to improve efficiency but are
--  optional and can be set to 0 or NULL if not known/required)
-- Example:
-- SELECT reg_replace(txt, '^[Tt][^ ]* ', 'a', TRUE, 2, 0) FROM tbl;
DROP FUNCTION IF EXISTS reg_replace;
DELIMITER //
CREATE FUNCTION reg_replace(subject VARCHAR(21845), pattern VARCHAR(21845),
  replacement VARCHAR(21845), greedy BOOLEAN, minMatchLen INT, maxMatchLen INT)
RETURNS VARCHAR(21845) DETERMINISTIC BEGIN 
  DECLARE result, subStr, usePattern VARCHAR(21845); 
  DECLARE startPos, prevStartPos, startInc, len, lenInc INT;
  IF subject REGEXP pattern THEN
    SET result = '';
    -- Sanitize input parameter values
    SET minMatchLen = IF(minMatchLen < 1, 1, minMatchLen);
    SET maxMatchLen = IF(maxMatchLen < 1 OR maxMatchLen > CHAR_LENGTH(subject),
                         CHAR_LENGTH(subject), maxMatchLen);
    -- Set the pattern to use to match an entire string rather than part of a string
    SET usePattern = IF (LEFT(pattern, 1) = '^', pattern, CONCAT('^', pattern));
    SET usePattern = IF (RIGHT(pattern, 1) = '$', usePattern, CONCAT(usePattern, '$'));
    -- Set start position to 1 if pattern starts with ^ or doesn't end with $.
    IF LEFT(pattern, 1) = '^' OR RIGHT(pattern, 1) <> '$' THEN
      SET startPos = 1, startInc = 1;
    -- Otherwise (i.e. pattern ends with $ but doesn't start with ^): Set start pos
    -- to the min or max match length from the end (depending on "greedy" flag).
    ELSEIF greedy THEN
      SET startPos = CHAR_LENGTH(subject) - maxMatchLen + 1, startInc = 1;
    ELSE
      SET startPos = CHAR_LENGTH(subject) - minMatchLen + 1, startInc = -1;
    END IF;
    WHILE startPos >= 1 AND startPos <= CHAR_LENGTH(subject)
      AND startPos + minMatchLen - 1 <= CHAR_LENGTH(subject)
      AND !(LEFT(pattern, 1) = '^' AND startPos <> 1)
      AND !(RIGHT(pattern, 1) = '$'
            AND startPos + maxMatchLen - 1 < CHAR_LENGTH(subject)) DO
      -- Set start length to maximum if matching greedily or pattern ends with $.
      -- Otherwise set starting length to the minimum match length.
      IF greedy OR RIGHT(pattern, 1) = '$' THEN
        SET len = LEAST(CHAR_LENGTH(subject) - startPos + 1, maxMatchLen), lenInc = -1;
      ELSE
        SET len = minMatchLen, lenInc = 1;
      END IF;
      SET prevStartPos = startPos;
      lenLoop: WHILE len >= 1 AND len <= maxMatchLen
                 AND startPos + len - 1 <= CHAR_LENGTH(subject)
                 AND !(RIGHT(pattern, 1) = '$' 
                       AND startPos + len - 1 <> CHAR_LENGTH(subject)) DO
        SET subStr = SUBSTRING(subject, startPos, len);
        IF subStr REGEXP usePattern THEN
          SET result = IF(startInc = 1,
                          CONCAT(result, replacement), CONCAT(replacement, result));
          SET startPos = startPos + startInc * len;
          LEAVE lenLoop;
        END IF;
        SET len = len + lenInc;
      END WHILE;
      IF (startPos = prevStartPos) THEN
        SET result = IF(startInc = 1, CONCAT(result, SUBSTRING(subject, startPos, 1)),
                        CONCAT(SUBSTRING(subject, startPos, 1), result));
        SET startPos = startPos + startInc;
      END IF;
    END WHILE;
    IF startInc = 1 AND startPos <= CHAR_LENGTH(subject) THEN
      SET result = CONCAT(result, RIGHT(subject, CHAR_LENGTH(subject) + 1 - startPos));
    ELSEIF startInc = -1 AND startPos >= 1 THEN
      SET result = CONCAT(LEFT(subject, startPos), result);
    END IF;
  ELSE
    SET result = subject;
  END IF;
  RETURN result;
END//
DELIMITER ;

демонстрация

Rextester Demo

Ограничения

Этот метод, конечно, займет некоторое время, когда строка темы велика. Обновление: теперь добавлены параметры минимальной и максимальной длины соответствия для повышения эффективности, когда они известны (ноль = неизвестно/не ограничено).
Это не позволит заменить обратные ссылки (например, \1, \2 и т.д.) Вместо групп захвата. Если эта функциональность необходима, просмотрите этот ответ, в котором предпринята попытка найти обходной путь путем обновления функции, чтобы разрешить вторичный поиск и замену в каждом найденном совпадении (за счет повышения сложности).
Если в шаблоне используются ^ и/или $, они должны быть в самом начале и в самом конце соответственно - например, шаблоны (^start|end$) не поддерживаются.
Есть флаг "жадный", чтобы указать, должно ли полное соответствие быть жадным или не жадным. Объединение жадного и ленивого сопоставления в одном регулярном выражении (например,. a.*?b.*) Не поддерживается.

Примеры использования

Эта функция была использована для ответа на следующие вопросы StackOverflow:

Steve Chambers 29 июль 2016, в 15:32

1

Вот Это Да! Идеально!
OscarR 03 авг. 2018, в 11:47

7

Вы можете это сделать... но это не очень мудрый... это примерно так же смело, как я попробую... насколько полный RegEx поддерживает ваше гораздо лучшее использование Perl или тому подобное.

UPDATE db.tbl
SET column = 
CASE 
WHEN column REGEXP '[[:<:]]WORD_TO_REPLACE[[:>:]]' 
THEN REPLACE(column,'WORD_TO_REPLACE','REPLACEMENT')
END 
WHERE column REGEXP '[[:<:]]WORD_TO_REPLACE[[:>:]]'

Eddie B 28 сен. 2012, в 03:30

1

Нет, это не сработает. Представьте, что ваш столбец содержит «asdfWORD_TO_REPLACE WORD_TO_REPLACE». Ваш метод приведет к «asdfREPLACEMENT REPLACEMENT», где правильный ответ будет «asdfWORD_TO_REPLACE REPLACEMENT».
Ryan Shillington 03 окт. 2012, в 17:14
1

@ Райан ... именно поэтому я заявил, что это было не очень мудро ... в случае использования, которое вы предоставляете, это определенно потерпит неудачу. Короче говоря, это плохая идея использовать структуру, похожую на регулярные выражения. Еще хуже ... если вы отбросите предложение where, все ваши значения будут NULL ...
Eddie B 03 окт. 2012, в 17:21
1

На самом деле Райан в этом случае ошибается, так как маркеры найдут совпадения только для слова «границы» нулевой длины, поэтому будут совпадать только слова с границами до и после слова ... Хотя это все еще плохая идея ...
Eddie B 10 окт. 2012, в 23:33
1

Э-э-э ... Я теряю некоторые очки здесь ... Пожалуйста, объясните, почему меня опускают, когда я четко заявил, что это "НЕ ОЧЕНЬ МУДРО"
Eddie B 05 март 2013, в 01:35
1

Я не голосовал против вас, но любой ответ, который говорит: «Это ужасная идея, и вы определенно не должны этого делать, но вот она: ...», вероятно, получит голосование :-).
Ryan Shillington 29 апр. 2013, в 17:46
2

@RyanShillington "Вздох ... Было бы разумнее просто не отвечать на этот вопрос :-)"
Eddie B 29 апр. 2013, в 18:16
3

Я думаю, что есть разница между «не мудрым» и «неправильным».
jmilloy 26 сен. 2013, в 14:32
0

@jmilloy ;-) Как таковой с 'Должен и Должен ...'
Eddie B 04 окт. 2013, в 18:55

Показать ещё 6 комментариев

4

Мы можем использовать условие IF в запросе SELECT, как показано ниже:

Предположим, что для чего-либо с "ABC", "ABC1", "ABC2", "ABC3",..., мы хотим заменить на "ABC", затем используя условие REGEXP и IF() в запросе SELECT, мы может достичь этого.

Синтаксис:

SELECT IF(column_name REGEXP 'ABC[0-9]$','ABC',column_name)
FROM table1 
WHERE column_name LIKE 'ABC%';

Пример:

SELECT IF('ABC1' REGEXP 'ABC[0-9]$','ABC','ABC1');

user3796869 01 дек. 2014, в 07:40

0

Здравствуйте, спасибо за предложение. Я пробовал что-то подобное, но производительность моих наборов данных была неудовлетворительной. Для небольших наборов это может быть жизнеспособным.
Piskvor 01 дек. 2014, в 08:38

1

Нижеследующее в основном находит первое совпадение слева, а затем заменяет все его совпадения (проверено в mysql-5.6).

Использование:

SELECT REGEX_REPLACE('dis ambiguity', 'dis[[:space:]]*ambiguity', 'disambiguity');

Реализация:

DELIMITER $$
CREATE FUNCTION REGEX_REPLACE(
  var_original VARCHAR(1000),
  var_pattern VARCHAR(1000),
  var_replacement VARCHAR(1000)
  ) RETURNS
    VARCHAR(1000)
  COMMENT 'Based on https://techras.wordpress.com/2011/06/02/regex-replace-for-mysql/'
BEGIN
  DECLARE var_replaced VARCHAR(1000) DEFAULT var_original;
  DECLARE var_leftmost_match VARCHAR(1000) DEFAULT
    REGEX_CAPTURE_LEFTMOST(var_original, var_pattern);
    WHILE var_leftmost_match IS NOT NULL DO
      IF var_replacement <> var_leftmost_match THEN
        SET var_replaced = REPLACE(var_replaced, var_leftmost_match, var_replacement);
        SET var_leftmost_match = REGEX_CAPTURE_LEFTMOST(var_replaced, var_pattern);
        ELSE
          SET var_leftmost_match = NULL;
        END IF;
      END WHILE;
  RETURN var_replaced;
END $$
DELIMITER ;

DELIMITER $$
CREATE FUNCTION REGEX_CAPTURE_LEFTMOST(
  var_original VARCHAR(1000),
  var_pattern VARCHAR(1000)
  ) RETURNS
    VARCHAR(1000)
  COMMENT '
  Captures the leftmost substring that matches the [var_pattern]
  IN [var_original], OR NULL if no match.
  '
BEGIN
  DECLARE var_temp_l VARCHAR(1000);
  DECLARE var_temp_r VARCHAR(1000);
  DECLARE var_left_trim_index INT;
  DECLARE var_right_trim_index INT;
  SET var_left_trim_index = 1;
  SET var_right_trim_index = 1;
  SET var_temp_l = '';
  SET var_temp_r = '';
  WHILE (CHAR_LENGTH(var_original) >= var_left_trim_index) DO
    SET var_temp_l = LEFT(var_original, var_left_trim_index);
    IF var_temp_l REGEXP var_pattern THEN
      WHILE (CHAR_LENGTH(var_temp_l) >= var_right_trim_index) DO
        SET var_temp_r = RIGHT(var_temp_l, var_right_trim_index);
        IF var_temp_r REGEXP var_pattern THEN
          RETURN var_temp_r;
          END IF;
        SET var_right_trim_index = var_right_trim_index + 1;
        END WHILE;
      END IF;
    SET var_left_trim_index = var_left_trim_index + 1;
    END WHILE;
  RETURN NULL;
END $$
DELIMITER ;

Nae 24 янв. 2019, в 23:55

Ещё вопросы

Это запрос функции с 2007 года: bugs.mysql.com/bug.php?id=27389 . Если вы действительно хотите эту функцию, войдите в систему и нажмите кнопку «Влияет на меня». Надеюсь, он получит достаточно голосов.
@ Томас: Я сделал это ... в 2009 году, когда я искал это. Поскольку прогресс в этом направлении был нулевым - очевидно, это не такая важная особенность. (кстати, у Postgres это есть: stackoverflow.com/questions/11722995/… )
Связанная, более простая версия этого вопроса: stackoverflow.com/questions/6942973/…
@Kzqai: Полезно знать, спасибо; Я отредактирую это в вопросе.
Я создал regexp_split (функция + процедура) и regexp_replace , которые реализованы с помощью REGEXP . Для простых поисков это сделает свое дело. Вы можете найти это здесь - так, это путь с хранимым кодом MySQL, без UDF. Если вы обнаружите некоторые ошибки, на которые не распространяются известные ограничения - не стесняйтесь открывать проблему.
IMO, выбор, использование PHP, а затем обновление mysql - не такой уж плохой взлом. Я предпочитаю использовать нативные методы MySQL, когда это возможно - предположительно, это быстрее. Но у меня есть система, которая использует много PHP, и она делает сотни тысяч таких замен за несколько секунд (система, которую я построил, предназначена именно для такой работы).
Нашел эту библиотеку из другого потока SO: github.com/mysqludf/lib_mysqludf_preg работает отлично.
REGEXP_REPLACE как пользовательская функция? Выглядит многообещающе, посмотрю на это. Спасибо!
Mysql не имеет этой встроенной функции. Мне сказали, что у Oracle это есть (но вам не поможет)
К сожалению, mysql-udf-regexp не поддерживает многобайтовые символы. regexp_replace ('äöõü', 'ä', '') возвращает длинную числовую строку вместо реального текста.
@lkraav Правда? эта вещь звучит как утечка безопасности, так как эта "длинная числовая строка" выглядит как переполнение буфера.
Ну, это было год назад, но я почти уверен, что правильно определил проблему в то время. Понятия не имею, добились ли они какого-либо прогресса, так как я не касался этого инструмента с тех пор.
Сам MySQL не поддерживает многобайтовые символы с его функциями RegEx.
Пользователи Windows: библиотека UDF, связанная здесь, похоже, не имеет хорошей поддержки Windows. Описанный метод установки Windows не работает для меня.
@lkraav, попробуйте библиотеку lib_mysqludf_preg ниже, так как она прекрасно работает. Это подробная версия, так как она возвращает BLOB-объект по умолчанию, и я не знаю, есть ли у вас многобайтовая кодировка по умолчанию: выберите cast (TR as char) COLLATE utf8_unicode_ci from (выберите preg_replace ('/ ä /', '', 'öõüä') R) T
Niiiice! Тем более, что мы уже перешли на него по несвязанным причинам. Спасибо за чаевые :)
Бенни - спасибо за то, что указал на это, но я немного запутался в фактической реализации ... не возражаешь по поводу моего вопроса здесь? stackoverflow.com/questions/27498929/… cc @Piskvor
В следующий раз, когда мне это понадобится, вот синтаксис для изменения целого столбца: UPDATE table SET Name = REGEXP_REPLACE(Name, "-2$", "\\1") Это удаляет -2 из abcxyz-2 из целого столбца в один раз.
Изменение всей платформы вряд ли является реалистичным решением.
@DavidBaucum MariaDB представляет собой замену MySQL. Так что это не «смена платформы», а скорее выбор другой авиакомпании для той же поездки
@ Benvorth MySQL 8.0 тоже поддерживает это .
Хорошо, это тоже должно сработать; Я не рассматривал автономную замену. Хорошие нестандартные мысли там!
Мне кажется странным, что вы использовали бы поиск таким образом, я бы сократил команду до sed -i 's / old_string / new_string / g' /path/to/dump.sql
может работать, если замена не может сломать сам SQL.
Очень рискованно и непрактично с большими наборами данных или с сохранением ссылочной целостности: для удаления данных и их последующей вставки вам придется отключить ссылочную целостность, на практике также отключив базу данных.
Использовав этот метод в прошлом, я согласен с Раулем, это очень рискованно. Вы также должны быть абсолютно уверены, что ваша строка не находится в вашем наборе данных.
Несколько лет спустя до ответа @speshak, но причина, по которой я выбрал такой файл, была в том, что я изначально очень нервничал по тем же причинам, что были упомянуты выше. В то время казалось, что отделение части «найти файл» от части «замена» облегчит чтение кода до его отправки.
Еще одно подтверждение: мне понравился этот метод, пока я не начал получать ошибки о количестве столбцов, не обрабатывающих ожидаемое значение (= сломал всю базу данных / таблицу).
Это также работает только на отдельных персонажей ..
Я только подчеркну вышеупомянутый пункт: эта функция заменяет символы, которые соответствуют однозначному выражению. Выше сказано, что он используется «для переотображения строк с помощью регулярных выражений», и это может быть немного обманчивым. Это делает свою работу, но это не та работа, о которой просят. (Не жалоба - это просто чтобы спасти людей на неверный путь)
Было бы более полезно включить код в ваш ответ, а не размещать голую ссылку.
select regex_replace('.*(abc).*','\1','noabcde') но, к сожалению, не работает со ссылками, такими как select regex_replace('.*(abc).*','\1','noabcde') (возвращает 'noabcde', а не 'abc').
@phobie кто-то другой сделал это в этом ответе - просто как ссылка на случай, если ссылка умрет;)
Я изменил этот метод, чтобы попытаться устранить некоторые из упомянутых выше ограничений и многое другое. Пожалуйста, посмотрите этот ответ .
Я понятия не имею, почему у этого ответа не было голосов, но это работает отлично.
@yellowmelon для чего нужны две пары двойных кавычек?
Он дополняет имя сотрудника пробелами до и после. Это позволяет ему искать и заменять (пробел) имя_служащего (пробел), что позволяет избежать перехвата имя_служащего "jay", если оно входит в большую строку "ajay". Затем он обрезает пробелы, когда закончите.
Похоже, довольно солидный обходной путь для замены слов!
Как бы вы обновили значение в таблице?
Нет, это не сработает. Представьте, что ваш столбец содержит «asdfWORD_TO_REPLACE WORD_TO_REPLACE». Ваш метод приведет к «asdfREPLACEMENT REPLACEMENT», где правильный ответ будет «asdfWORD_TO_REPLACE REPLACEMENT».
@ Райан ... именно поэтому я заявил, что это было не очень мудро ... в случае использования, которое вы предоставляете, это определенно потерпит неудачу. Короче говоря, это плохая идея использовать структуру, похожую на регулярные выражения. Еще хуже ... если вы отбросите предложение where, все ваши значения будут NULL ...
На самом деле Райан в этом случае ошибается, так как маркеры найдут совпадения только для слова «границы» нулевой длины, поэтому будут совпадать только слова с границами до и после слова ... Хотя это все еще плохая идея ...
Э-э-э ... Я теряю некоторые очки здесь ... Пожалуйста, объясните, почему меня опускают, когда я четко заявил, что это "НЕ ОЧЕНЬ МУДРО"
Я не голосовал против вас, но любой ответ, который говорит: «Это ужасная идея, и вы определенно не должны этого делать, но вот она: ...», вероятно, получит голосование :-).
@RyanShillington "Вздох ... Было бы разумнее просто не отвечать на этот вопрос :-)"
Я думаю, что есть разница между «не мудрым» и «неправильным».
@jmilloy ;-) Как таковой с 'Должен и Должен ...'
Здравствуйте, спасибо за предложение. Я пробовал что-то подобное, но производительность моих наборов данных была неудовлетворительной. Для небольших наборов это может быть жизнеспособным.

Lukasz Szozda · Accepted Answer · 2018-04-19T17-48-00.000Z

MySQL 8. 0+ вы можете использовать изначально REGEXP_REPLACE.

12.5.2 Регулярные выражения:

REGEXP_REPLACE (expr, pat, repl [, pos [, появление [, match_type]]])

Заменяет вхождения в строке expr, которые соответствуют регулярному выражению, указанному патчем шаблона, с заменой заменяющей строки и возвращает полученную строку. Если выражение, pat или repl равно NULL, возвращаемое значение равно NULL.

и поддержка регулярных выражений:

Ранее MySQL использовала библиотеку регулярных выражений Генри Спенсера для поддержки операторов регулярных выражений (REGEXP, RLIKE).

Поддержка регулярных выражений была повторно реализована с использованием международных компонентов для Unicode (ICU), которая обеспечивает полную поддержку Unicode и является многобайтовой безопасностью. Функция REGEXP_LIKE() выполняет регулярное выражение в соответствии с операторами REGEXP и RLIKE, которые теперь являются синонимами для этой функции. Кроме того, доступны функции REGEXP_INSTR(), REGEXP_REPLACE() и REGEXP_SUBSTR() для нахождения позиций соответствия и выполнения подстановки и извлечения подстроки, соответственно.

SELECT REGEXP_REPLACE('Stackoverflow','[A-Zf]','-',1,0,'c'); 
-- Output:
-tackover-low

Демоверсия DBFiddle