Как преобразовать строку в нижний регистр в Bash?

Question

Как преобразовать строку в нижний регистр в Bash?

810

Есть ли способ в bash преобразовать строку в строчную строку?

Например, если у меня есть:

a="Hi all"

Я хочу преобразовать его в:

"hi all"

assassin 15 фев. 2010, в 07:05

Источник

0

Смотрите также : stackoverflow.com/questions/11392189
dreftymac 29 март 2018, в 16:04

Теги:

string

bash

shell

17 ответов

295

В Bash 4:

В нижнем регистре

$ string="A FEW WORDS"
$ echo "${string,}"
a FEW WORDS
$ echo "${string,,}"
a few words
$ echo "${string,,[AEIUO]}"
a FeW WoRDS

$ string="A Few Words"
$ declare -l string
$ string=$string; echo "$string"
a few words

В верхний регистр

$ string="a few words"
$ echo "${string^}"
A few words
$ echo "${string^^}"
A FEW WORDS
$ echo "${string^^[aeiou]}"
A fEw wOrds

$ string="A Few Words"
$ declare -u string
$ string=$string; echo "$string"
A FEW WORDS

Переключить (недокументированный, но необязательно настраиваемый во время компиляции)

$ string="A Few Words"
$ echo "${string~~}"
a fEW wORDS
$ string="A FEW WORDS"
$ echo "${string~}"
a FEW WORDS
$ string="a few words"
$ echo "${string~}"
A few words

Заглавная (недокументированная, но необязательно конфигурируемая во время компиляции)

$ string="a few words"
$ declare -c string
$ string=$string
$ echo "$string"
A few words

Случай с заголовком:

$ string="a few words"
$ string=($string)
$ string="${string[@]^}"
$ echo "$string"
A Few Words

$ declare -c string
$ string=(a few words)
$ echo "${string[@]}"
A Few Words

$ string="a FeW WOrdS"
$ string=${string,,}
$ string=${string~}
$ echo "$string"

Чтобы отключить атрибут declare, используйте +. Например, declare +c string. Это влияет на последующие назначения, а не на текущее значение.

Параметры declare изменяют атрибут переменной, но не содержимое. Перераспределения в моих примерах обновляют содержимое, чтобы показать изменения.

Edit:

Добавлен "переключить первый символ по слову" (${var~}), как предлагается ghostdog74.

Изменить: Исправлено поведение тильды в соответствии с Bash 4.3.

Dennis Williamson 15 фев. 2010, в 11:05

5

есть также ${string~}
ghostdog74 15 фев. 2010, в 10:52
5

Довольно странно, операторы «^^» и «,,» не работают с не-ASCII-символами, но «~~» работает ... So string="łódź"; echo ${string~~} вернет "ŁÓDŹ", но echo ${string^^} вернет "łóDź". Даже в LC_ALL=pl_PL.utf-8 . Это использует Bash 4.2.24.
Hubert Kario 12 июль 2012, в 16:48
2

@HubertKario: это странно. То же самое для меня в Bash 4.0.33 с той же строкой в en_US.UTF-8 . Это ошибка, и я сообщил об этом.
Dennis Williamson 12 июль 2012, в 18:20
1

@HubertKario: попробуйте echo "$string" | tr '[:lower:]' '[:upper:]' . Это, вероятно, будет демонстрировать ту же ошибку. Таким образом, проблема, по крайней мере, частично не Баш.
Dennis Williamson 13 июль 2012, в 00:44
1

@DennisWilliamson: Да, я тоже это заметил (см. Комментарий к ответу Шувалова). Я бы просто сказал: «Этот материал предназначен только для ASCII», но тогда работает оператор «~~», поэтому он не похож на код и таблицы перевода еще не там ...
Hubert Kario 14 июль 2012, в 14:13
4

@HubertKario: сопровождающий Bash подтвердил ошибку и заявил, что она будет исправлена в следующем выпуске.
Dennis Williamson 14 июль 2012, в 14:27
0

В следующей echo ${string^} прописными буквами является только первая буква предложения (даже если есть несколько слов) echo ${string^} что весьма полезно, если вы пишете историю на Bash (протестировано в версии 4.1.2 на RHEL6.5).
Yaron 21 сен. 2014, в 13:10
0

@vaxquis: Я возвращаясь изменения, потому что declare не само по себе, изменить содержимое переменной. Переназначение необходимо. Последнее переназначение преобразует скаляр в массив. Он мог быть непосредственно назначен в виде массива, но переназначение иллюстрирует, как скаляр может быть заключен в заголовок.
Dennis Williamson 13 окт. 2017, в 20:11
0

@vaxquis: я добавил заявление на этот счет. В будущем вам не следует редактировать пост без предварительного тестирования ваших изменений.
Dennis Williamson 13 окт. 2017, в 20:46
0

@DennisWilliamson, верьте мне или нет, в моем сценарии это работало даже без переназначения ... может потому, что оно использовалось в цикле, не знаю? проверьте, если для себя: pastebin.com/ZG52LBHf
vaxquis 13 окт. 2017, в 20:47
1

@vaxquis: Сначала убедитесь, что атрибут очищен: declare +uw , затем запустите этот цикл (эквивалентный for w in word1 word2 word3 word4; do declare -uw; echo "$w"; done ): for w in word1 word2 word3 word4; do declare -uw; echo "$w"; done - «word1» выводится как есть, а остальные - в верхнем регистре. Если вы запустите цикл снова без очистки атрибута, все выходные слова будут в верхнем регистре. Как я уже сказал в своем ответе, атрибут применяется к значению при присваивании, а не при объявлении. Фактически, если вам не нужно менять атрибут с каждой итерацией цикла, вы должны поместить объявление перед циклом, так как нет необходимости ...
Dennis Williamson 17 июнь 2018, в 18:15
1

... установить атрибут снова, как только он установлен. declare -uw; for w in word1 word2 word3 word4; do echo "$w"; done
Dennis Williamson 17 июнь 2018, в 18:16

Показать ещё 10 комментариев

108

echo "Hi All" | tr "[:upper:]" "[:lower:]"

shuvalov 15 фев. 2010, в 07:31

2

+1 за не английский
Richard Hansen 03 фев. 2012, в 19:00
4

@RichardHansen: tr не работает для меня для не-ACII символов. У меня есть правильный набор локали и сгенерированные файлы локали. Есть идеи, что я могу делать не так?
Hubert Kario 12 июль 2012, в 16:56
0

К вашему сведению: это работало на Windows / Msys. Некоторые другие предложения не сделали.
wasatchwizard 23 окт. 2014, в 16:42

Показать ещё 1 комментарий

65

tr:

a="$(tr [A-Z] [a-z] <<< "$a")"

AWK:

{ print tolower($0) }

sed:

y/ABCDEFGHIJKLMNOPQRSTUVWXYZ/abcdefghijklmnopqrstuvwxyz/

Ignacio Vazquez-Abrams 15 фев. 2010, в 08:43

2

+1 a="$(tr [AZ] [az] <<< "$a")" выглядит мне проще всего. Я все еще начинающий ...
Sandeepan Nath 02 фев. 2011, в 11:12
1

Я настоятельно рекомендую решение sed ; Я работал в среде, которая по какой-то причине не имеет tr но мне еще не удалось найти систему без sed , плюс большую часть времени я хочу сделать это, я все равно просто сделал что-то еще в sed поэтому можно объединить команды в один (длинный) оператор.
Haravikk 19 окт. 2013, в 12:54
2

Скобочные выражения должны быть в кавычках. В tr [AZ] [az] A оболочка может выполнять расширение имени файла, если существуют имена файлов, состоящие из одной буквы, или задан нулевой блок. tr "[AZ]" "[az]" A будет вести себя правильно.
Dennis 06 нояб. 2013, в 19:49
0

@ Харавикк не tr ? Что это за оправдание для системы? Там даже сборки Windows. И это так просто, сценарий оболочки может его заполнить (но вы можете взглянуть на Busybox для этой системы).
Camilo Martin 14 июнь 2014, в 08:15
2

@CamiloMartin - это система BusyBox, где у меня возникла эта проблема, в частности, NAS-устройства Synology, но я столкнулся с ней и в некоторых других системах. В последнее время я делал много межплатформенных сценариев оболочки, и с требованием, чтобы ничего лишнего не устанавливалось, это усложняет задачу! Однако мне еще не приходилось сталкиваться с системой без sed
Haravikk 15 июнь 2014, в 10:51
0

@Haravikk Да, я бы ожидал, что sed будет с большей вероятностью отсутствовать, чем tr , будучи гораздо более способным и многофункциональным. У него есть gcc или что-то? Возможно, компиляция busybox из исходного кода может облегчить вашу жизнь (я не представляю, насколько легко / сложно работать с таким устройством).
Camilo Martin 15 июнь 2014, в 23:12
2

Обратите внимание, что tr [AZ] [az] неверно почти во всех локалях. например, в локали en-US AZ фактически является интервалом AaBbCcDdEeFfGgHh...XxYyZ .
fuz 31 янв. 2016, в 14:54
0

Я думаю, что скобки в tr бесполезны и могут быть удалены: unix.stackexchange.com/questions/51983/…
Ciro Santilli 新疆改造中心六四事件法轮功 09 май 2018, в 16:29

Показать ещё 6 комментариев

30

Я знаю, что это старая должность, но я сделал этот ответ для другого сайта, поэтому я подумал, что разместил его здесь:

ВЕРХНИЙ → нижний: используйте python:

b=`echo "print '$a'.lower()" | python`

Или Ruby:

b=`echo "print '$a'.downcase" | ruby`

Или Perl (возможно, мой любимый):

b=`perl -e "print lc('$a');"`

Или PHP:

b=`php -r "print strtolower('$a');"`

Или Awk:

b=`echo "$a" | awk '{ print tolower($1) }'`

Или Sed:

b=`echo "$a" | sed 's/./\L&/g'`

Или Bash 4:

b=${a,,}

Или NodeJS, если у вас есть (и немного орехи...):

b=`echo "console.log('$a'.toLowerCase());" | node`

Вы также можете использовать dd (но я бы не стал!):

b=`echo "$a" | dd  conv=lcase 2> /dev/null`

ниже → ВЕРХНИЙ:

использовать python:

b=`echo "print '$a'.upper()" | python`

Или Ruby:

b=`echo "print '$a'.upcase" | ruby`

Или Perl (возможно, мой любимый):

b=`perl -e "print uc('$a');"`

Или PHP:

b=`php -r "print strtoupper('$a');"`

Или Awk:

b=`echo "$a" | awk '{ print toupper($1) }'`

Или Sed:

b=`echo "$a" | sed 's/./\U&/g'`

Или Bash 4:

b=${a^^}

Или NodeJS, если у вас есть (и немного орехи...):

b=`echo "console.log('$a'.toUpperCase());" | node`

Вы также можете использовать dd (но я бы не стал!):

b=`echo "$a" | dd  conv=ucase 2> /dev/null`

Также, когда вы говорите "оболочка", я предполагаю, что вы имеете в виду bash, но если вы можете использовать zsh, это так же просто, как

b=$a:l

для нижнего регистра и

b=$a:u

для верхнего регистра.

nettux443 14 май 2014, в 09:57

2

Ни команда sed, ни команда bash не работали для меня.
JESii 28 май 2015, в 21:42
0

@JESii оба работают для меня верхний -> нижний и нижний -> верхний. Я использую sed 4.2.2 и Bash 4.3.42 (1) на 64-битной Debian Stretch.
nettux 20 нояб. 2015, в 14:33
1

Привет, @ nettux443 ... Я только что снова попытался выполнить операцию bash, и она все равно не работает с сообщением об ошибке "плохая замена". Я на OSX использую bash для homebrew: GNU bash, версия 4.3.42 (1) -релиз (x86_64-apple-darwin14.5.0)
JESii 21 нояб. 2015, в 17:34
5

Не использовать! Все примеры, которые генерируют сценарий, являются чрезвычайно хрупкими; если значение a содержит одинарную кавычку, у вас не только нарушенное поведение, но и серьезная проблема безопасности.
tripleee 16 янв. 2016, в 11:45
0

Мне нравится решение sed больше всего, так как sed всегда вездесущ.
Dudi Boy 09 дек. 2017, в 13:47
0

Я предпочитаю использовать решение дд. Обратите внимание, что вам нужно быть пользователем root, чтобы это работало
inetphantom 06 март 2019, в 14:05

Показать ещё 4 комментария

22

В zsh:

echo $a:u

Надо любить zsh!

Scott Smedley 27 янв. 2011, в 05:37

3

или $ a: l для преобразования в нижний регистр
Scott Smedley 27 янв. 2011, в 05:39
0

Добавьте еще один случай: echo ${(C)a} #Upcase the first char only
biocyberman 24 июль 2015, в 23:26

15

Использование GNU sed:

sed 's/.*/\L&/'

Пример:

$ foo="Some STRIng";
$ foo=$(echo "$foo" | sed 's/.*/\L&/')
$ echo "$foo"
some string

devnull 26 сен. 2013, в 16:30

10

Для стандартной оболочки (без багизмов), использующей только встроенные функции:

uppers=ABCDEFGHIJKLMNOPQRSTUVWXYZ
lowers=abcdefghijklmnopqrstuvwxyz

lc(){ #usage: lc "SOME STRING" -> "some string"
    i=0
    while ([ $i -lt ${#1} ]) do
        CUR=${1:$i:1}
        case $uppers in
            *$CUR*)CUR=${uppers%$CUR*};OUTPUT="${OUTPUT}${lowers:${#CUR}:1}";;
            *)OUTPUT="${OUTPUT}$CUR";;
        esac
        i=$((i+1))
    done
    echo "${OUTPUT}"
}

И для верхнего регистра:

uc(){ #usage: uc "some string" -> "SOME STRING"
    i=0
    while ([ $i -lt ${#1} ]) do
        CUR=${1:$i:1}
        case $lowers in
            *$CUR*)CUR=${lowers%$CUR*};OUTPUT="${OUTPUT}${uppers:${#CUR}:1}";;
            *)OUTPUT="${OUTPUT}$CUR";;
        esac
        i=$((i+1))
    done
    echo "${OUTPUT}"
}

technosaurus 21 янв. 2012, в 10:48

0

Интересно, не допустили ли вы некоторого башизма в этом сценарии, поскольку он не переносим во FreeBSD sh: $ {1: $ ...}: плохая замена
Dereckson 23 нояб. 2014, в 19:52
2

В самом деле; подстроки с ${var:1:1} являются башизмом.
tripleee 14 апр. 2015, в 07:09
0

Этот подход имеет довольно плохие показатели производительности. Смотрите мой ответ для метрик.
Dejay Clayton 28 июль 2018, в 23:39

Показать ещё 1 комментарий

7

Pre Bash 4.0

Bash Опустить случай строки и назначить переменной

VARIABLE=$(echo "$VARIABLE" | tr '[:upper:]' '[:lower:]') 

echo "$VARIABLE"

hawkeye126 21 авг. 2013, в 18:31

4

Нет необходимости в echo и каналах: используйте $(tr '[:upper:]' '[:lower:]' <<<"$VARIABLE")
Tino 11 дек. 2015, в 16:23
2

@Tino Строка here также не переносима на действительно старые версии Bash; Я считаю, что это было введено в v3.
tripleee 16 янв. 2016, в 12:28
1

@tripleee Вы правы, он был представлен в bash-2.05b - однако это самый старый bash, который мне удалось найти в моих системах.
Tino 17 янв. 2016, в 14:28

Показать ещё 1 комментарий

7

В bash 4 вы можете использовать набор

Пример:

A="HELLO WORLD"
typeset -l A=$A

c4f4t0r 21 авг. 2013, в 12:06

7

Регулярное выражение

Я хотел бы взять на себя ответственность за команду, которую хочу поделиться, но правда в том, что я получил ее для собственного использования из http://commandlinefu.com, Преимущество состоит в том, что если вы cd в любой каталог в своей домашней папке, то это изменит все файлы и папки на нижний регистр рекурсивно, пожалуйста, используйте с осторожностью. Это блестящее исправление командной строки и особенно полезно для тех множества альбомов, которые вы сохранили на своем диске.

find . -depth -exec rename 's/(.*)\/([^\/]*)/$1\/\L$2/' {} \;

Вы можете указать каталог вместо точки (.) после поиска, которая обозначает текущий каталог или полный путь.

Надеюсь, что это решение окажется полезным тем, что эта команда не делает, это заменить пробелы символами подчеркивания - возможно, еще раз.

Derek Shaw 24 янв. 2011, в 13:59

2

спасибо за commandlinefu.com
Wadih M. 29 нояб. 2011, в 01:31
0

Это не сработало для меня по любой причине, хотя выглядит хорошо. Я сделал это работать в качестве альтернативы: найти. -exec / bin / bash -c 'mv {} `tr [AZ] [az] <<< {}`' \;
John Rix 26 июнь 2013, в 15:58
0

Для этого требуется prename из perl : dpkg -S "$(readlink -e /usr/bin/rename)" дает perl: /usr/bin/prename
Tino 11 дек. 2015, в 16:27

Показать ещё 1 комментарий

4

Вы можете попробовать это

s="Hello World!" 

echo $s  # Hello World!

a=${s,,}
echo $a  # hello world!

b=${s^^}
echo $b  # HELLO WORLD!

ref: http://wiki.workassis.com/shell-script-convert-text-to-lowercase-and-uppercase/

Bikesh M Annur 23 март 2017, в 07:09

3

Для версий Bash, предшествующих 4.0, эта версия должна быть самой быстрой (так как она не выполняет fork/exec любые команды):

function string.monolithic.tolower
{
   local __word=$1
   local __len=${#__word}
   local __char
   local __octal
   local __decimal
   local __result

   for (( i=0; i<__len; i++ ))
   do
      __char=${__word:$i:1}
      case "$__char" in
         [A-Z] )
            printf -v __decimal '%d' "'$__char"
            printf -v __octal '%03o' $(( $__decimal ^ 0x20 ))
            printf -v __char \\$__octal
            ;;
      esac
      __result+="$__char"
   done
   REPLY="$__result"
}

ответ technosaurus также имел потенциал, хотя он действительно работал правильно для меня.

Orwellophile 24 март 2013, в 14:12

0

Неплохо! Для анализа эффективности этого подхода, пожалуйста, смотрите мой ответ для метрик.
Dejay Clayton 28 июль 2018, в 23:40

2

Многие ответы используют внешние программы, которые на самом деле не используют Bash.

Если вы знаете, что у вас будет доступный Bash4, вы должны просто использовать нотацию ${VAR,,} (это легко и просто). Для Bash до 4 (например, для моего Mac по-прежнему используется Bash 3.2). Я использовал исправленную версию ответа @ghostdog74 для создания более переносимой версии.

Вы можете вызвать lowercase 'my STRING' и получить версию в нижнем регистре. Я читал комментарии об установке результата в var, но это не очень переносимо в Bash, так как мы не можем возвращать строки. Печать - лучшее решение. Легко захватывать с чем-то вроде var="$(lowercase $str)".

Как это работает

Как это работает, получая целочисленное представление ASCII каждого char с printf, а затем adding 32, если upper-to->lower, или subtracting 32, если lower-to->upper. Затем снова используйте printf, чтобы преобразовать число обратно в char. Из 'A' -to-> 'a' мы имеем разницу в 32 символа.

Используя printf, чтобы объяснить:

$ printf "%d\n" "'a"
97
$ printf "%d\n" "'A"
65

97 - 65 = 32

И это рабочая версия с примерами.
Обратите внимание на комментарии в коде, так как они объясняют многое:

#!/bin/bash

# lowerupper.sh

# Prints the lowercase version of a char
lowercaseChar(){
    case "$1" in
        [A-Z])
            n=$(printf "%d" "'$1")
            n=$((n+32))
            printf \\$(printf "%o" "$n")
            ;;
        *)
            printf "%s" "$1"
            ;;
    esac
}

# Prints the lowercase version of a sequence of strings
lowercase() {
    word="$@"
    for((i=0;i<${#word};i++)); do
        ch="${word:$i:1}"
        lowercaseChar "$ch"
    done
}

# Prints the uppercase version of a char
uppercaseChar(){
    case "$1" in
        [a-z])
            n=$(printf "%d" "'$1")
            n=$((n-32))
            printf \\$(printf "%o" "$n")
            ;;
        *)
            printf "%s" "$1"
            ;;
    esac
}

# Prints the uppercase version of a sequence of strings
uppercase() {
    word="$@"
    for((i=0;i<${#word};i++)); do
        ch="${word:$i:1}"
        uppercaseChar "$ch"
    done
}

# The functions will not add a new line, so use echo or
# append it if you want a new line after printing

# Printing stuff directly
lowercase "I AM the Walrus!"$'\n'
uppercase "I AM the Walrus!"$'\n'

echo "----------"

# Printing a var
str="A StRing WITH mixed sTUFF!"
lowercase "$str"$'\n'
uppercase "$str"$'\n'

echo "----------"

# Not quoting the var should also work, 
# since we use "$@" inside the functions
lowercase $str$'\n'
uppercase $str$'\n'

echo "----------"

# Assigning to a var
myLowerVar="$(lowercase $str)"
myUpperVar="$(uppercase $str)"
echo "myLowerVar: $myLowerVar"
echo "myUpperVar: $myUpperVar"

echo "----------"

# You can even do stuff like
if [[ 'option 2' = "$(lowercase 'OPTION 2')" ]]; then
    echo "Fine! All the same!"
else
    echo "Ops! Not the same!"
fi

exit 0

И результаты после запуска:

$ ./lowerupper.sh 
i am the walrus!
I AM THE WALRUS!
----------
a string with mixed stuff!
A STRING WITH MIXED STUFF!
----------
a string with mixed stuff!
A STRING WITH MIXED STUFF!
----------
myLowerVar: a string with mixed stuff!
myUpperVar: A STRING WITH MIXED STUFF!
----------
Fine! All the same!

Это должно работать только для символов ASCII, но.

Для меня это прекрасно, так как я знаю, что буду передавать только ASCII-символы.
Я использую это для некоторых нечувствительных к регистру параметров CLI, например.

Gus Neves 16 май 2017, в 11:31

2

Несмотря на то, насколько старый этот вопрос и похож на этот ответ technosaurus. Мне было трудно найти решение, которое было переносимым на большинстве платформ (это я использую), а также более старые версии bash. Я также был расстроен массивами, функциями и использованием отпечатков, эхо и временных файлов для извлечения тривиальных переменных. Это очень хорошо для меня, я думал, что поделюсь. Моей основной средой тестирования являются:

GNU bash, версия 4.1.2 (1) -release (x86_64-redhat-linux-gnu)

GNU bash, версия 3.2.57 (1) -release (sparc-sun-solaris2.10)

lcs="abcdefghijklmnopqrstuvwxyz"
ucs="ABCDEFGHIJKLMNOPQRSTUVWXYZ"
input="Change Me To All Capitals"
for (( i=0; i<"${#input}"; i++ )) ; do :
    for (( j=0; j<"${#lcs}"; j++ )) ; do :
        if [[ "${input:$i:1}" == "${lcs:$j:1}" ]] ; then
            input="${input/${input:$i:1}/${ucs:$j:1}}" 
        fi
    done
done

Простой C-стиль для цикла для итерации по строкам. Для строки ниже, если вы не видели ничего подобного раньше здесь я узнал об этом. В этом случае строка проверяет, существует ли char ${input: $i: 1} (строчный регистр) во входном файле, и если он заменяет его заданным char ${ucs: $j: 1} (верхний регистр ) и сохраняет его обратно на вход.

input="${input/${input:$i:1}/${ucs:$j:1}}"

JaredTS486 23 дек. 2015, в 18:52

0

Это крайне неэффективно, в вашем примере выше 650 циклов и 35 секунд для выполнения 1000 вызовов на моем компьютере. Для альтернативы, которая повторяется всего 11 раз и требует менее 5 секунд для выполнения 1000 вызовов, см. Мой альтернативный ответ.
Dejay Clayton 28 июль 2018, в 17:20
1

Спасибо, хотя это должно быть очевидно, просто глядя на это. Возможно, ошибки страницы связаны с размером ввода и количеством выполняемых итераций. Тем не менее мне нравится ваше решение.
JaredTS486 09 авг. 2018, в 19:24

2

При использовании v4 это запеченный. Если нет, вот простое, широко применимое решение. Другие ответы (и комментарии) по этой теме были весьма полезны при создании кода ниже.

# Like echo, but converts to lowercase
echolcase () {
    tr [:upper:] [:lower:] <<< "${*}"
}

# Takes one arg by reference (var name) and makes it lowercase
lcase () { 
    eval "${1}"=\'$(echo ${!1//\'/"'\''"} | tr [:upper:] [:lower:] )\'
}

Примечания:

Выполнение: a="Hi All", а затем: lcase a будет делать то же самое, что: a=$( echolcase "Hi All" )
В lcase-функции использование ${!1//\'/"'\''"} вместо ${!1} позволяет работать, даже если строка содержит кавычки.

Stephen M. Harris 22 март 2013, в 22:50

0

Сохранить преобразованную строку в переменную. После работы для меня - $SOURCE_NAME до $TARGET_NAME

TARGET_NAME="`echo $SOURCE_NAME | tr '[:upper:]' '[:lower:]'`"

nitinr708 08 июль 2016, в 10:56

Ещё вопросы

Смотрите также : stackoverflow.com/questions/11392189
Довольно странно, операторы «^^» и «,,» не работают с не-ASCII-символами, но «~~» работает ... So string="łódź"; echo ${string~~} вернет "ŁÓDŹ", но echo ${string^^} вернет "łóDź". Даже в LC_ALL=pl_PL.utf-8 . Это использует Bash 4.2.24.
@HubertKario: это странно. То же самое для меня в Bash 4.0.33 с той же строкой в en_US.UTF-8 . Это ошибка, и я сообщил об этом.
@HubertKario: попробуйте echo "$string" | tr '[:lower:]' '[:upper:]' . Это, вероятно, будет демонстрировать ту же ошибку. Таким образом, проблема, по крайней мере, частично не Баш.
@DennisWilliamson: Да, я тоже это заметил (см. Комментарий к ответу Шувалова). Я бы просто сказал: «Этот материал предназначен только для ASCII», но тогда работает оператор «~~», поэтому он не похож на код и таблицы перевода еще не там ...
@HubertKario: сопровождающий Bash подтвердил ошибку и заявил, что она будет исправлена в следующем выпуске.
В следующей echo ${string^} прописными буквами является только первая буква предложения (даже если есть несколько слов) echo ${string^} что весьма полезно, если вы пишете историю на Bash (протестировано в версии 4.1.2 на RHEL6.5).
@vaxquis: Я возвращаясь изменения, потому что declare не само по себе, изменить содержимое переменной. Переназначение необходимо. Последнее переназначение преобразует скаляр в массив. Он мог быть непосредственно назначен в виде массива, но переназначение иллюстрирует, как скаляр может быть заключен в заголовок.
@vaxquis: я добавил заявление на этот счет. В будущем вам не следует редактировать пост без предварительного тестирования ваших изменений.
@DennisWilliamson, верьте мне или нет, в моем сценарии это работало даже без переназначения ... может потому, что оно использовалось в цикле, не знаю? проверьте, если для себя: pastebin.com/ZG52LBHf
@vaxquis: Сначала убедитесь, что атрибут очищен: declare +uw , затем запустите этот цикл (эквивалентный for w in word1 word2 word3 word4; do declare -uw; echo "$w"; done ): for w in word1 word2 word3 word4; do declare -uw; echo "$w"; done - «word1» выводится как есть, а остальные - в верхнем регистре. Если вы запустите цикл снова без очистки атрибута, все выходные слова будут в верхнем регистре. Как я уже сказал в своем ответе, атрибут применяется к значению при присваивании, а не при объявлении. Фактически, если вам не нужно менять атрибут с каждой итерацией цикла, вы должны поместить объявление перед циклом, так как нет необходимости ...
... установить атрибут снова, как только он установлен. declare -uw; for w in word1 word2 word3 word4; do echo "$w"; done
@RichardHansen: tr не работает для меня для не-ACII символов. У меня есть правильный набор локали и сгенерированные файлы локали. Есть идеи, что я могу делать не так?
К вашему сведению: это работало на Windows / Msys. Некоторые другие предложения не сделали.
+1 a="$(tr [AZ] [az] <<< "$a")" выглядит мне проще всего. Я все еще начинающий ...
Я настоятельно рекомендую решение sed ; Я работал в среде, которая по какой-то причине не имеет tr но мне еще не удалось найти систему без sed , плюс большую часть времени я хочу сделать это, я все равно просто сделал что-то еще в sed поэтому можно объединить команды в один (длинный) оператор.
Скобочные выражения должны быть в кавычках. В tr [AZ] [az] A оболочка может выполнять расширение имени файла, если существуют имена файлов, состоящие из одной буквы, или задан нулевой блок. tr "[AZ]" "[az]" A будет вести себя правильно.
@ Харавикк не tr ? Что это за оправдание для системы? Там даже сборки Windows. И это так просто, сценарий оболочки может его заполнить (но вы можете взглянуть на Busybox для этой системы).
@CamiloMartin - это система BusyBox, где у меня возникла эта проблема, в частности, NAS-устройства Synology, но я столкнулся с ней и в некоторых других системах. В последнее время я делал много межплатформенных сценариев оболочки, и с требованием, чтобы ничего лишнего не устанавливалось, это усложняет задачу! Однако мне еще не приходилось сталкиваться с системой без sed
@Haravikk Да, я бы ожидал, что sed будет с большей вероятностью отсутствовать, чем tr , будучи гораздо более способным и многофункциональным. У него есть gcc или что-то? Возможно, компиляция busybox из исходного кода может облегчить вашу жизнь (я не представляю, насколько легко / сложно работать с таким устройством).
Обратите внимание, что tr [AZ] [az] неверно почти во всех локалях. например, в локали en-US AZ фактически является интервалом AaBbCcDdEeFfGgHh...XxYyZ .
Я думаю, что скобки в tr бесполезны и могут быть удалены: unix.stackexchange.com/questions/51983/…
Ни команда sed, ни команда bash не работали для меня.
@JESii оба работают для меня верхний -> нижний и нижний -> верхний. Я использую sed 4.2.2 и Bash 4.3.42 (1) на 64-битной Debian Stretch.
Привет, @ nettux443 ... Я только что снова попытался выполнить операцию bash, и она все равно не работает с сообщением об ошибке "плохая замена". Я на OSX использую bash для homebrew: GNU bash, версия 4.3.42 (1) -релиз (x86_64-apple-darwin14.5.0)
Не использовать! Все примеры, которые генерируют сценарий, являются чрезвычайно хрупкими; если значение a содержит одинарную кавычку, у вас не только нарушенное поведение, но и серьезная проблема безопасности.
Мне нравится решение sed больше всего, так как sed всегда вездесущ.
Я предпочитаю использовать решение дд. Обратите внимание, что вам нужно быть пользователем root, чтобы это работало
или $ a: l для преобразования в нижний регистр
Добавьте еще один случай: echo ${(C)a} #Upcase the first char only
Интересно, не допустили ли вы некоторого башизма в этом сценарии, поскольку он не переносим во FreeBSD sh: $ {1: $ ...}: плохая замена
В самом деле; подстроки с ${var:1:1} являются башизмом.
Этот подход имеет довольно плохие показатели производительности. Смотрите мой ответ для метрик.
Нет необходимости в echo и каналах: используйте $(tr '[:upper:]' '[:lower:]' <<<"$VARIABLE")
@Tino Строка here также не переносима на действительно старые версии Bash; Я считаю, что это было введено в v3.
@tripleee Вы правы, он был представлен в bash-2.05b - однако это самый старый bash, который мне удалось найти в моих системах.
Это не сработало для меня по любой причине, хотя выглядит хорошо. Я сделал это работать в качестве альтернативы: найти. -exec / bin / bash -c 'mv {} `tr [AZ] [az] <<< {}`' \;
Для этого требуется prename из perl : dpkg -S "$(readlink -e /usr/bin/rename)" дает perl: /usr/bin/prename
Неплохо! Для анализа эффективности этого подхода, пожалуйста, смотрите мой ответ для метрик.
Это крайне неэффективно, в вашем примере выше 650 циклов и 35 секунд для выполнения 1000 вызовов на моем компьютере. Для альтернативы, которая повторяется всего 11 раз и требует менее 5 секунд для выполнения 1000 вызовов, см. Мой альтернативный ответ.
Спасибо, хотя это должно быть очевидно, просто глядя на это. Возможно, ошибки страницы связаны с размером ввода и количеством выполняемых итераций. Тем не менее мне нравится ваше решение.

ghostdog74 · Accepted Answer · 2010-02-15T08-06-00.000Z

1319

Лучший ответ

Существуют различные способы:

tr

$ echo "$a" | tr '[:upper:]' '[:lower:]'
hi all

AWK

$ echo "$a" | awk '{print tolower($0)}'
hi all

Bash 4.0

$ echo "${a,,}"
hi all

Perl

$ echo "$a" | perl -ne 'print lc'
hi all

Bash

lc(){
    case "$1" in
        [A-Z])
        n=$(printf "%d" "'$1")
        n=$((n+32))
        printf \\$(printf "%o" "$n")
        ;;
        *)
        printf "%s" "$1"
        ;;
    esac
}
word="I Love Bash"
for((i=0;i<${#word};i++))
do
    ch="${word:$i:1}"
    lc "$ch"
done

ghostdog74 15 фев. 2010, в 08:06

8

Я что-то упустил, или ваш последний пример (в Bash) действительно делает что-то совершенно другое? Это работает для "ABX", но если вместо этого сделать word="Hi All" как в других примерах, возвращается ha , а не hi all . Он работает только для заглавных букв и пропускает буквы в нижнем регистре.
jangosteve 14 янв. 2012, в 21:58
25

Обратите внимание, что в стандарте POSIX указаны только примеры tr и awk .
Richard Hansen 03 фев. 2012, в 18:55
166

tr '[:upper:]' '[:lower:]' будет использовать текущую локаль для определения эквивалентов в верхнем и нижнем регистре, поэтому она будет работать с локалями, которые используют буквы с диакритическими знаками.
Richard Hansen 03 фев. 2012, в 18:58
9

Как получить выход в новую переменную? Т.е. сказать, что я хочу, чтобы строчная строка в новую переменную?
Adam Parkin 25 сен. 2012, в 18:01
52

@Adam: b="$(echo $a | tr '[AZ]' '[az]')"
Tino 14 нояб. 2012, в 15:39
0

@RichardHansen Мой "tr (GNU coreutils) 8.21" во FreeBSD не работает для локалей UTF-8. Так же как и tr на нашей стандартной Ubuntu 12.04.
Ark-kun 03 апр. 2013, в 07:50
0

@ Ark-kun: работает нормально в моей системе Ubuntu 12.04: (export LC_ALL=en_US.utf8; echo FOO | tr '[:upper:]' '[:lower:]') печатает foo
Richard Hansen 03 апр. 2013, в 17:59
0

@RichardHansen Первые 128 символов ASCII всегда работают. Все остальные тысячи персонажей этого не делают. На FreeBSD 9 tr работает нормально. В Ubuntu 12.04 tr не работает должным образом с нелатинскими символами в локалях utf-8: $ echo -e 'FOO\xC0\xD0\xE0\xF0' | iconv -f cp1251 -t utf-8 | LC_ALL=ru_RU.UTF-8 tr '[:upper:]' '[:lower:]' | iconv -f utf-8 fooАРар (не работает); $ echo -e 'FOO\xC0\xD0\xE0\xF0' | LC_ALL=ru_RU.CP1251 tr '[:upper:]' '[:lower:]' fooарар (работает)
Ark-kun 03 апр. 2013, в 18:12
0

@ Арк-кун: я рекомендую создать новый вопрос по этому поводу.
Richard Hansen 03 апр. 2013, в 18:21
1

@ Adam снова: b="${a,,}" для Bash4 более эффективно, чем b="$(echo ${a,,})" . Оба немного отличаются, так как при a="H W" (3 пробела между H и W) первые наборы b="h w" (3 пробела), последний b="h w" (1 пробел) (извините, SO удаляет несколько пробелов в примерах)
Tino 07 авг. 2013, в 14:50
0

Как мне сделать это в sh (ака dash )
Shiplu Mokaddim 06 сен. 2013, в 11:24
0

В Ubuntu 12.10 awk '{print tolower($0)}' приятно конвертирует символы, зависящие от локали, но это не так: ${a,,} tr '[:upper:]' '[:lower:]' .
Stéphane Gourichon 17 сен. 2013, в 09:01
1

Так круто: ${VAR,,}
Brett 18 фев. 2014, в 09:49
0

Я что-то здесь упускаю? Я вижу много команд, которые печатают строчную версию переменной, но ни одной, которая фактически изменяет значение.
AaronF 07 авг. 2015, в 16:45
0

@AaronF Вот как часто используется оболочка: вывод команды оболочки на stdout является ее «результатом» (код выхода - скорее состояние исключения). Чтобы сохранить этот «результат», используйте обозначение a=$(…) упомянутое выше.
Alfe 19 май 2016, в 09:39
0

было бы лучше, если бы примеры были обновлены, чтобы присвоить переменной, а не отражать их.
malhal 31 июль 2016, в 15:32
1

сокращенное решение для awk трубы: $ (awk 'END {print tolower (s);}' s = "$ a" / dev / null)
Austin France 09 нояб. 2016, в 15:07
0

на Ubuntu, у меня нет команды tr
Alexander Mills 05 дек. 2016, в 07:52
0

В качестве альтернативы, b = echo $a | tr '[AZ]' '[az]' всегда работал для меня. Прилагаемые знаки - это тики назад, ключ чуть ниже клавиши Esc.
kvaibhav 14 дек. 2016, в 07:15
0

@jangosteve, вы были правы насчет примера Bash, сейчас это исправлено. Только заглавные буквы обрабатывались, а все остальное отбрасывалось. Я добавил «passthru» printf для других символов и изменил пример на пример с верхним и нижним символами и пробелами. Кстати, заглавными буквами, просто измените +32 на -32.
Gus Neves 13 май 2017, в 18:12
1

@AlexanderMills, tr стандартизирован - все системы POSIX должны включать его. Ubuntu абсолютно делает.
Charles Duffy 13 окт. 2017, в 20:30
0

echo "$a" склонен к ошибке, например, если a="-n" . Для безопасности используйте printf : result="$(printf "%s" "$a" | tr '[:upper:]' '[:lower:]')"
joeytwiddle 20 окт. 2017, в 17:38
0

Не могли бы вы отредактировать пост и добавить различия между этими подходами?
Reihan_amn 22 май 2018, в 16:46
0

Производительность этого подхода для Bash pre-4.0 довольно плохая, см. Мой ответ для метрик.
Dejay Clayton 28 июль 2018, в 23:38

Показать ещё 22 комментария