Regex Преобразование строковых сокращений в заглавный регистр

Question

Regex Преобразование строковых сокращений в заглавный регистр

0

В рамках простой функции очистки/прошивки URL-адресов я расширяю, мне нужно сделать такие преобразования, как:

Original               Converted
---------------------------------------------
USAMarch               UsaMarch
FETExaminations        FetExaminations      *
AnotherABBRString      AnotherAbbrString
LastONE                LastOne

(Это всего лишь примеры, за исключением второго, что и заставило меня сделать это в первую очередь.)

Я предполагаю, что мне нужно использовать preg_replace_callback чтобы определить положение любых аббревиатур и preg_replace_callback их в соответствие.

У меня нет туманности, с чего начать. Кто-нибудь знает, что я могу сделать, чтобы понять это правильно?

Обновить

Хорошо, у меня это до сих пор:

$input = preg_replace_callback("~([A-Z])([A-Z]+)([^a-z])([a-z]|)~",
function ($captures) {
   return $captures[1].strtolower($captures[2]).$captures[3].$captures[4];
},
$input);

К сожалению, однако, он не работает со строками, где последнее сокращение:

This                   Becomes
---------------------------------------------
LastONE                LastOnE

Полагаю, я проверю конец неправильно. Кроме того, эта попытка не является рекурсивной. Как мне это сделать?

Mike Rockétt 05 янв. 2015, в 19:02

Источник

1

Можете ли вы поделиться тем, что вы, возможно, пытались?
Jay Blanchard 05 янв. 2015, в 17:53
0

Извините, но я не смог понять, с чего начать ... Все, что я придумал, не сработает. Например, я мог бы сопоставить две заглавные буквы в последовательности, а затем заменить вторую ее нижним эквивалентом, но это сломает новые слова ...
Mike Rockétt 05 янв. 2015, в 17:55
0

Например, AnotherABBRString станет AnotherAbbrstring , а это не то, что я хочу.
Mike Rockétt 05 янв. 2015, в 17:55
0

Вам придется проверять каждую букву до тех пор, пока вы не встретите строчную букву, а затем вернитесь назад.
Jay Blanchard 05 янв. 2015, в 18:03
0

Обновили мой вопрос. (Примечание: я не профессионал Regex, поэтому, пожалуйста, потерпите меня ...)
Mike Rockétt 05 янв. 2015, в 18:05
1

@MikeAnthony Я просто спрашиваю себя, как PHP должен знать, что это 2 слова? ( UsaMarch ) Как php узнает об этом? у вас есть словарный массив?
Rizier123 05 янв. 2015, в 18:06
1

Я не смог бы иметь словарь, потому что есть слишком много возможностей ...
Mike Rockétt 05 янв. 2015, в 18:07
1

Тем не менее, вы совершенно правы, @Rizier123. Rizier123. Я вижу, как нет абсолютно идеального способа сделать это из-за того, что существует так много возможностей. Но, эй, у кого-то может быть почти идеальное решение, которое для меня намного лучше, чем ничего.
Mike Rockétt 05 янв. 2015, в 18:18

Показать ещё 6 комментариев

Теги:

php

callback

regex

1 ответ

Ещё вопросы

Можете ли вы поделиться тем, что вы, возможно, пытались?
Извините, но я не смог понять, с чего начать ... Все, что я придумал, не сработает. Например, я мог бы сопоставить две заглавные буквы в последовательности, а затем заменить вторую ее нижним эквивалентом, но это сломает новые слова ...
Например, AnotherABBRString станет AnotherAbbrstring , а это не то, что я хочу.
Вам придется проверять каждую букву до тех пор, пока вы не встретите строчную букву, а затем вернитесь назад.
Обновили мой вопрос. (Примечание: я не профессионал Regex, поэтому, пожалуйста, потерпите меня ...)
@MikeAnthony Я просто спрашиваю себя, как PHP должен знать, что это 2 слова? ( UsaMarch ) Как php узнает об этом? у вас есть словарный массив?
Я не смог бы иметь словарь, потому что есть слишком много возможностей ...
Тем не менее, вы совершенно правы, @Rizier123. Rizier123. Я вижу, как нет абсолютно идеального способа сделать это из-за того, что существует так много возможностей. Но, эй, у кого-то может быть почти идеальное решение, которое для меня намного лучше, чем ничего.

sln · Accepted Answer · 2015-01-05T17-24-00.000Z

Они работают с вашими примерами.

Даже находит одиночные шапки.

 # Find:  '/([A-Z])([A-Z]+)(?=[A-Z]|\b)/'
 # Replace:  $1 . tolower($2)

 ( [A-Z] )                     # (1), Upper case
 ( [A-Z]+ )                    # (2), 1 or more upper case
 (?=                           # Lookahead assertion
      [A-Z]                         # Upper case
   |                              # or,
      \b                            # Word boundry
 )

Или, требуется нижний регистр перед возможными концевыми крышками

 # Find:  '/([a-z])?([A-Z])([A-Z]+)(?=[A-Z]|(?(1)\b|(?!)))/'
 # Replace:  $1$2 . tolower($3)

 ( [a-z] )?                    # (1), optional lower case
 ( [A-Z] )                     # (2), Upper case
 ( [A-Z]+ )                    # (3), 1 or more upper case
 (?=                           # Lookahead assertion
      [A-Z]                         # Upper case
   |                              # or
      (?(1)                         # Conditional, does lower case precede this ?
           \b                            # yes, match boundry
        |  (?!)                          # or fail, this is a stand alone cap's
      )
 )

Это довольно превосходно - спасибо! Это работает для большинства случаев, включая те, которые я не перечислил в своем вопросе.
@MikeAnthony - Пожалуйста, рад, что ты начал.