Как разбить строку на разделителе в Bash?

Question

Как разбить строку на разделителе в Bash?

1584

У меня есть эта строка, хранящаяся в переменной:

IN="[email protected];[email protected]"

Теперь я хотел бы разделить строки на разделитель ;, чтобы у меня было:

ADDR1="[email protected]"
ADDR2="[email protected]"

Мне необязательно нужны переменные ADDR1 и ADDR2. Если они являются элементами массива, которые еще лучше.

После предложений из нижеприведенных ответов я закончил следующее, что было после:

#!/usr/bin/env bash

IN="[email protected];[email protected]"

mails=$(echo $IN | tr ";" "\n")

for addr in $mails
do
    echo "> [$addr]"
done

Вывод:

> [[email protected]]
> [[email protected]]

Было решение, связанное с установкой Internal_field_separator (IFS) на ;. Я не уверен, что случилось с этим ответом, как вы reset IFS вернулись к умолчанию?

RE: IFS solution, я пробовал это, и он работает, я сохраняю старый IFS, а затем восстанавливаю его:

IN="[email protected];[email protected]"

OIFS=$IFS
IFS=';'
mails2=$IN
for x in $mails2
do
    echo "> [$x]"
done

IFS=$OIFS

Кстати, когда я пробовал

mails2=($IN)

У меня появилась первая строка при печати в цикле, без скобок вокруг $IN она работает.

stefanB 28 май 2009, в 03:51

Источник

13

Что касается вашего «Edit2»: вы можете просто «сбросить IFS», и он вернется в состояние по умолчанию. Нет необходимости сохранять и восстанавливать его явно, если только у вас нет причин ожидать, что для него уже установлено значение, отличное от значения по умолчанию. Более того, если вы делаете это внутри функции (а если нет, то почему бы и нет?), Вы можете установить IFS в качестве локальной переменной, и он вернется к своему предыдущему значению после выхода из функции.
Brooks Moses 01 май 2012, в 01:26
17

@BrooksMoses: (a) +1 за использование local IFS=... где это возможно; (b) -1 для unset IFS , это точно не сбрасывает IFS к его значению по умолчанию, хотя я считаю, что неустановленный IFS ведет себя так же, как и значение по умолчанию IFS ($ '\ t \ n'), однако это кажется плохим практикуйте слепое предположение, что ваш код никогда не будет вызываться с IFS, установленным в произвольное значение; (c) другая идея состоит в том, чтобы вызвать подоболочку: (IFS=$custom; ...) при выходе из подоболочки IFS вернется к тому, что было изначально.
dubiousjim 31 май 2012, в 05:21
0

Я просто хочу быстро взглянуть на пути, чтобы решить, куда бросить исполняемый файл, поэтому я прибег к запуску ruby -e "puts ENV.fetch('PATH').split(':')" . Если вы хотите остаться чистым, bash не поможет, но проще использовать любой язык сценариев со встроенным разделением.
nicooga 07 март 2016, в 15:32
0

Это своего рода комментарий на диске, но, поскольку OP использовал адреса электронной почты в качестве примера, кто-нибудь удосужился ответить на него так, чтобы он полностью соответствовал RFC 5322, а именно, что любая строка в кавычках может появляться перед @, что означает, что вы Вам понадобятся регулярные выражения или какой-то другой вид парсера вместо наивного использования IFS или других упрощенных функций сплиттера.
Jeff 22 апр. 2018, в 17:51
1

for x in $(IFS=';';echo $IN); do echo "> [$x]"; done
user2037659 26 апр. 2018, в 20:15
1

Чтобы сохранить его в виде массива, я должен был поставить еще один набор скобок и изменить \n просто на пробел. Поэтому последняя строка - это mails=($(echo $IN | tr ";" " ")) . Так что теперь я могу проверять элементы mails с помощью массива нотации mails[index] или просто повторяя цикл
afranques 03 июль 2018, в 14:08
0

Для чего стоит, решение tr не работает так же, как в zsh.
Ben Kushigian 03 окт. 2018, в 20:13

Показать ещё 5 комментариев

Теги:

bash

shell

scripting

34 ответа

781

Взято из Bash shell script split array:

IN="[email protected];[email protected]"
arrIN=(${IN//;/ })

Пояснение:

Эта конструкция заменяет все вхождения ';' (начальная // означает глобальную замену) в строке IN с помощью ' ' (одно пробел), а затем интерпретирует строку с разделителями пробела как массив (это что окружающие круглые скобки).

Синтаксис, используемый внутри фигурных скобок для замены каждого символа ';' символом ' ', называется Расширение параметров.

Есть некоторые распространенные ошибки:

Если исходная строка содержит пробелы, вам нужно будет использовать IFS:
- IFS=':'; arrIN=($IN); unset IFS;
Если исходная строка содержит пробелы, а разделитель - это новая строка, вы можете установить IFS с помощью:
- IFS=$'\n'; arrIN=($IN); unset IFS;

palindrom 10 март 2011, в 09:26

71

Я просто хочу добавить: это самый простой из всех, вы можете получить доступ к элементам массива с помощью $ {arrIN [1]} (конечно, начиная с нулей)
Oz123 21 март 2011, в 18:50
24

Нашел его: техника изменения переменной внутри $ {} известна как «расширение параметров».
KomodoDave 05 янв. 2012, в 15:13
8

Если вы хотите разделить специальный символ, такой как тильда (~), убедитесь, что вы его не указали: arrIN = ($ {IN // \ ~ /})
David Parks 01 дек. 2012, в 04:21
23

Работает ли это, когда исходная строка содержит пробелы?
qbolec 25 фев. 2013, в 09:12
21

Нет, я не думаю, что это работает, когда присутствуют также пробелы ... это преобразование ',' в '', а затем построение массива, разделенного пробелами.
Ethan 12 апр. 2013, в 22:47
11

Очень краткий, но есть предостережения для общего использования : оболочка применяет разбиение слов и расширения к строке, что может быть нежелательным; просто попробуйте. IN="[email protected];[email protected];*;broken apart" . Вкратце: этот подход сломается, если ваши токены содержат встроенные пробелы и / или символы. такие как * которые случаются, чтобы токен совпадал с именами файлов в текущей папке.
mklement0 24 апр. 2013, в 14:08
43

Это плохой подход по другим причинам: например, если ваша строка содержит ;*; , тогда * будет расширен до списка имен файлов в текущем каталоге. -1
Charles Duffy 06 июль 2013, в 14:39
2

На самом деле вы можете исправить проблему с пробелами, используя IFS вместо расширения / замены параметров: IFS=':' arrIN=($IN) Это также несколько более читабельно, на мой взгляд.
Kyle Strand 18 фев. 2015, в 23:37
3

@KyleStrand Это устанавливает IFS , а затем устанавливает arrIN , как если бы они были выполнены в отдельных строках или разделены arrIN a ; , То есть назначения являются временными, только если они появляются перед командой без назначения. Поэтому после IFS=':' arrIN=($IN) , echo "$IFS" дает : и слова разделяются на : для последующих команд, которые обычно не нужны. (Это легко пропустить, так как echo $var достаточно, чтобы проверить, является ли $var : когда : нет в $IFS .) Поэтому, за исключением, возможно, самого конца сценария, IFS=':' arrIN=($IN) IFS=$' \t\n' или IFS=':' arrIN=($IN); unset IFS является предпочтительным.
Eliah Kagan 08 май 2015, в 00:18
0

@EliahKagan Ах. Есть ли какая-то польза от этого конкретного несоответствия?
Kyle Strand 08 май 2015, в 00:50
0

@KyleStrand Да, в том смысле, что, хотя имеет смысл область назначения переменной для команды, на самом деле не имеет смысла ограничивать область назначения одной переменной другой. Оболочка выполняет расширение переменных / параметров перед тем, как присваивать значения (или запускать команды). Например, x=foo echo $x не выводит foo , так как $x раскрывается до того, как foo назначается для x или запускается echo . Аналогично, если x=foo y=$x должны были назначить foo для x только тогда , когда y=$x побежал, то y будет присвоен оригинальный $x (не foo ) , потому что $x будет расширяться , прежде чем какие - либо переменные задания произошло.
Eliah Kagan 08 май 2015, в 02:42
0

@CharlesDuffy Этого можно избежать с помощью set -f : set -f; IN="[email protected];*;[email protected]"; arrIN=(${IN//;/ }); echo ${arrIN[1]}
John_West 06 янв. 2016, в 01:08
3

@John_West, да, этот подход можно использовать, изменив глобальное состояние, чтобы отключить глобализацию (и взять под строгий контроль дальнейшее глобальное состояние в форме IFS ), но ... ну, зачем вам это делать, когда read -a доступны без каких-либо рисков?
Charles Duffy 06 янв. 2016, в 04:19
1

@ Спасибо за то, что указали на проблему с наличием пробелов, и я удивлен, что этот вопрос не был в ответе. Я взял на себя смелость отредактировать ответ, чтобы упомянуть эту ошибку и найти решение для нее (и еще одной ошибки). (@EliahKagan спасибо за хорошее решение, которое согласуется с первоначальным ответом.)
Trevor Boyd Smith 17 июнь 2016, в 16:10
2

Не уверен, почему IFS=';' declare -a arr=($IN) не получает больше кредита здесь. Нет необходимости устанавливать какие-либо промежуточные переменные, изменение IFS относится только к одной команде declare , и мы расширяем IFS, а не заменяем его другим.
ghoti 03 сен. 2016, в 19:12
0

Не должен IFS=':'; быть IFS=';'; соответствовать входной строке? в последнем примере
zpon 08 нояб. 2016, в 07:29
0

Почему синтаксис arrIN=(${IN//;/ }) когда помещается в цикл for в скрипте bash?
Nikos Alexandris 05 нояб. 2018, в 16:07

Показать ещё 15 комментариев

217

Если вы не возражаете обрабатывать их немедленно, мне нравится делать это:

for i in $(echo $IN | tr ";" "\n")
do
  # process
done

Вы можете использовать этот тип цикла для инициализации массива, но, вероятно, это более простой способ сделать это. Надеюсь, что это поможет.

Chris Lutz 28 май 2009, в 02:47

0

Вы должны были сохранить ответ IFS. Это научило меня чему-то, чего я не знал, и определенно создал массив, тогда как это просто дешевая замена.
Chris Lutz 28 май 2009, в 02:42
0

Понимаю. Да, я нахожу себя в этих глупых экспериментах, я буду учиться чему-то новому каждый раз, когда пытаюсь что-то ответить. Я отредактировал материал, основанный на обратной связи #bash IRC и восстановленный :)
Johannes Schaub - litb 28 май 2009, в 02:59
32

-1, вы явно не знаете о разбиении слов, потому что это вносит две ошибки в ваш код. Один - когда вы не заключаете в кавычки $ IN, а другой - когда вы притворяетесь, что новая строка - единственный разделитель, используемый в разделении слов. Вы перебираете каждое слово в IN, а не каждую строку, и ОПРЕДЕЛЕННО не каждый элемент, разделенный точкой с запятой, хотя может показаться, что побочный эффект выглядит так, как будто он работает.
lhunath 28 май 2009, в 06:12
2

Вы можете изменить его на эхо "$ IN" | tr ';' '\ n' | пока читаешь -r ADDY; do # process "$ ADDY"; Я думаю, что это сделано для того, чтобы ему повезло. Обратите внимание, что это приведет к развороту, и вы не сможете изменить внешние переменные внутри цикла (поэтому я использовал синтаксис <<< "$ IN"), а затем
Johannes Schaub - litb 28 май 2009, в 17:00
7

Подводя итоги дискуссии в комментариях: Предостережения для общего пользования : оболочка применяет разбиение слов и расширения к строке, что может быть нежелательным; просто попробуйте. IN="[email protected];[email protected];*;broken apart" . Вкратце: этот подход сломается, если ваши токены содержат встроенные пробелы и / или символы. такие как * которые случаются, чтобы токен совпадал с именами файлов в текущей папке.
mklement0 24 апр. 2013, в 14:13
0

Это очень полезный ответ. например, IN=abc;def;123 . Как мы можем также напечатать номер индекса? echo $count $i ?
user8864088 10 окт. 2018, в 18:50

Показать ещё 4 комментария

115

Совместимый ответ

В этом вопросе SO уже есть много другого способа сделать это в bash. Но bash имеет много специальных функций, так называемых bashism, которые работают хорошо, но это не будет работать ни в одном другом shell.

В частности, массивы, ассоциативный массив и подстановка шаблонов являются чистыми bashisms и могут не работать под другими оболочками.

В моем Debian GNU/Linux есть стандартная оболочка под названием dash, но я знаю многих людей, которые любят использовать ksh.

Наконец, в очень маленькой ситуации есть специальный инструмент busybox со своим интерпретатором оболочки (ash).

Запрошенная строка

Образец строки в вопросе SO:

IN="[email protected];[email protected]"

Поскольку это может быть полезно с пробелами, и поскольку пробелы могут изменять результат подпрограммы, я предпочитаю использовать эту примерную строку:

 IN="[email protected];[email protected];Full Name <[email protected]>"

Разделить строку на основе разделителя в bash (версия >= 4.2)

При чистом bash мы можем использовать массивы и IFS:

var="[email protected];[email protected];Full Name <[email protected]>"

oIFS="$IFS"
IFS=";"
declare -a fields=($var)
IFS="$oIFS"
unset oIFS

IFS=\; read -a fields <<<"$var"

Использование этого синтаксиса в недавнем bash не меняет $IFS для текущего сеанса, но только для текущей команды:

set | grep ^IFS=
IFS=$' \t\n'

Теперь строка var разделяется и сохраняется в массиве (с именем fields):

set | grep ^fields=\\\|^var=
fields=([0]="[email protected]" [1]="[email protected]" [2]="Full Name <[email protected]>")
var='[email protected];[email protected];Full Name <[email protected]>'

Мы можем запросить переменное содержимое с помощью declare -p:

declare -p var fields
declare -- var="[email protected];[email protected];Full Name <[email protected]>"
declare -a fields=([0]="[email protected]" [1]="[email protected]" [2]="Full Name <[email protected]>")

read - самый быстрый способ выполнить разделение, потому что не существует вил и внешних ресурсов.

Оттуда вы можете использовать синтаксис, который вы уже знаете для обработки каждого поля:

for x in "${fields[@]}";do
    echo "> [$x]"
    done
> [[email protected]]
> [[email protected]]
> [Full Name <[email protected]>]

или отбросить каждое поле после обработки (мне нравится этот подход переключения):

while [ "$fields" ] ;do
    echo "> [$fields]"
    fields=("${fields[@]:1}")
    done
> [[email protected]]
> [[email protected]]
> [Full Name <[email protected]>]

или даже для простой распечатки (более короткий синтаксис):

printf "> [%s]\n" "${fields[@]}"
> [[email protected]]
> [[email protected]]
> [Full Name <[email protected]>]

Разделить строку на основе разделителя в shell

Но если вы напишете что-нибудь, пригодное для использования во многих оболочках, вы должны использовать не бахизмы.

Существует синтаксис, используемый во многих оболочках, для разделения строки на первое или последнее вхождение подстроки:

${var#*SubStr}  # will drop begin of string up to first occur of `SubStr`
${var##*SubStr} # will drop begin of string up to last occur of `SubStr`
${var%SubStr*}  # will drop part of string from last occur of `SubStr` to the end
${var%%SubStr*} # will drop part of string from first occur of `SubStr` to the end

(Отсутствие этого является основной причиной публикации моего ответа;)

Как указано Score_Under:

# и % удалите кратчайшую совпадающую строку и

## и %% удалить максимально возможное время.

Этот небольшой образец script работает хорошо под bash, dash, ksh, busybox и также был протестирован в Mac OS bash:

var="[email protected];[email protected];Full Name <[email protected]>"
while [ "$var" ] ;do
    iter=${var%%;*}
    echo "> [$iter]"
    [ "$var" = "$iter" ] && \
        var='' || \
        var="${var#*;}"
  done
> [[email protected]]
> [[email protected]]
> [Full Name <[email protected]>]

Удачи!

F. Hauri 13 апр. 2013, в 15:00

12

Подстановки # , ## , % и %% имеют то, что IMO проще запомнить (насколько они удаляются): # и % удаляют самую короткую подходящую строку, а ## и %% удаляют самую длинную из возможных.
Score_Under 28 апр. 2015, в 16:58
1

IFS=\; read -a fields <<<"$var" завершается с ошибкой на новых строках и добавляет завершающий перевод на новую строку. Другое решение удаляет завершающее пустое поле.
sorontar 26 окт. 2016, в 04:36
0

Разделитель оболочки - самый элегантный ответ, точка.
Eric Chen 30 авг. 2017, в 17:50
0

Может ли последняя альтернатива использоваться со списком разделителей полей, установленным где-то еще? Например, я имею в виду использовать его в качестве сценария оболочки и передавать список разделителей полей в качестве позиционного параметра.
sancho.s 04 окт. 2018, в 03:42
0

Да, в цикле: for sep in "#" "ł" "@" ; do ... var="${var#*$sep}" ...
F. Hauri 04 окт. 2018, в 07:47

Показать ещё 3 комментария

77

Я видел пару ответов, ссылающихся на команду cut, но все они были удалены. Немного странно, что об этом никто не говорил, потому что я считаю это одной из наиболее полезных команд для этого типа вещей, особенно для разбора файлов журналов с разделителями.

В случае разделения этого конкретного примера на массив bash script tr, вероятно, более эффективен, но cut может быть использован и более эффективен, если вы хотите вытащить определенные поля из средний.

Пример:

$ echo "[email protected];[email protected]" | cut -d ";" -f 1
[email protected]
$ echo "[email protected];[email protected]" | cut -d ";" -f 2
[email protected]

Вы можете, очевидно, поместить это в цикл и перебрать параметр -f, чтобы вытащить каждое поле независимо.

Это становится более полезным, если у вас есть файл журнала с разделителями с такими строками:

2015-04-27|12345|some action|an attribute|meta data

cut очень удобно, чтобы иметь возможность cat этого файла и выбрать конкретное поле для дальнейшей обработки.

DougW 27 апр. 2015, в 19:03

4

Слава за использование cut , это правильный инструмент для работы! Очищено намного больше, чем любой из этих взломов.
MisterMiyagi 02 нояб. 2016, в 08:42
4

Этот подход будет работать, только если вы заранее знаете количество элементов; вам нужно запрограммировать немного логики вокруг него. Он также запускает внешний инструмент для каждого элемента.
uli42 14 сен. 2017, в 08:30
0

Как я искал, пытаясь избежать пустой строки в CSV. Теперь я могу указать точное значение столбца. Работа с IFS уже используется в цикле. Лучше, чем ожидалось для моей ситуации.
Louis Loudog Trottier 10 май 2018, в 04:20

Показать ещё 1 комментарий

76

Как насчет этого подхода:

IN="[email protected];[email protected]" 
set -- "$IN" 
IFS=";"; declare -a Array=($*) 
echo "${Array[@]}" 
echo "${Array[0]}" 
echo "${Array[1]}"

Источник

errator 28 май 2009, в 12:25

6

+1 ... но я бы не назвал переменную "Массив" ... пэт пев, наверное. Хорошее решение
Yzmir Ramirez 05 сен. 2011, в 01:06
14

+1 ... но "установить" и объявить -a не нужны. Вы могли бы также использовать только IFS";" && Array=($IN)
ata 03 нояб. 2011, в 22:33
0

+1 Только примечание: не рекомендуется ли сохранить старый IFS, а затем восстановить его? (как показывает stefanB в его edit3) люди, приземляющиеся здесь (иногда просто копирующие и вставляющие решение), могут не думать об этом
Luca Borrione 03 сен. 2012, в 09:26
6

-1: во-первых, @ata прав, что большинство команд в этом ничего не делают. Во-вторых, он использует расщепление слов для формирования массива и не делает ничего, чтобы запретить глобальное расширение при этом (поэтому, если у вас есть символы глобуса в любом из элементов массива, эти элементы заменяются соответствующими именами файлов).
Charles Duffy 06 июль 2013, в 14:44
1

Предложите использовать $'...' : IN=$'[email protected];[email protected];bet <d@\ns* kl.com>' . Затем echo "${Array[2]}" выведет строку с символом новой строки. set -- "$IN" также необходим в этом случае. Да, чтобы предотвратить глобальное расширение, решение должно включать set -f .
John_West 08 янв. 2016, в 12:29

Показать ещё 3 комментария

62

Это сработало для меня:

string="1;2"
echo $string | cut -d';' -f1 # output is 1
echo $string | cut -d';' -f2 # output is 2

Steven Lizarazo 11 авг. 2016, в 21:39

1

Cut работает только с одним символом в качестве разделителя.
mojjj 08 янв. 2018, в 08:57
0

Хотя он работает только с одним символом-разделителем, это то, что ищет OP (записи, разделенные точкой с запятой).
GuyPaddock 12 дек. 2018, в 01:37

61

echo "[email protected];[email protected]" | sed -e 's/;/\n/g'
[email protected]
[email protected]

lothar 28 май 2009, в 03:51

3

-1 что если строка содержит пробелы? например IN="this is first line; this is second line" arrIN=( $( echo "$IN" | sed -e 's/;/\n/g' ) ) создаст массив из 8 элементов в этом case (элемент для каждого слова разделен пробелом), а не 2 (элемент для каждой строки разделен точкой с запятой)
Luca Borrione 03 сен. 2012, в 10:08
3

@ Luca Нет, скрипт sed создает ровно две строки. То, что создает несколько записей для вас, это когда вы помещаете их в массив bash (который по умолчанию разделяется на пробелы)
lothar 03 сен. 2012, в 17:33
0

В том-то и дело: OP должен хранить записи в массиве, чтобы зацикливаться на нем, как вы можете видеть в его правках. Я думаю, что ваш (хороший) ответ упущен для упоминания об использовании arrIN=( $( echo "$IN" | sed -e 's/;/\n/g' ) ) для достижения этого, а также о совете изменить IFS на IFS=$'\n' для тех, кто приземлится здесь в будущем и должен разбить строку, содержащую пробелы. (и восстановить его потом). :)
Luca Borrione 04 сен. 2012, в 07:09
1

@ Лука Хороший вопрос. Однако, когда я написал этот ответ, назначения массива не было в первоначальном вопросе.
lothar 04 сен. 2012, в 16:55

Показать ещё 2 комментария

59

Это также работает:

IN="[email protected];[email protected]"
echo ADD1=`echo $IN | cut -d \; -f 1`
echo ADD2=`echo $IN | cut -d \; -f 2`

Будьте осторожны, это решение не всегда правильно. Если вы передадите только "[email protected]", он назначит его как ADD1, так и ADD2.

Ashok 08 сен. 2012, в 05:07

1

Вы можете использовать -s, чтобы избежать упомянутой проблемы: superuser.com/questions/896800/… "-f, --fields = LIST выбрать только эти поля; также вывести любую строку, которая не содержит символа-разделителя, если опция -s не указано»
fersarr 03 март 2016, в 17:17

31

Я думаю, AWK - лучшая и эффективная команда для решения вашей проблемы. AWK включен в Bash по умолчанию почти в каждом дистрибутиве Linux.

echo "[email protected];[email protected]" | awk -F';' '{print $1,$2}'

даст

[email protected] [email protected]

Конечно, вы можете хранить каждый адрес электронной почты, переопределяя поле печати awk.

Tony 14 янв. 2013, в 06:52

2

Или еще проще: echo "[email protected]; [email protected]" | awk 'BEGIN {RS = ";"} {print}'
Jaro 07 янв. 2014, в 21:30
0

@Jaro Это отлично сработало, когда у меня была строка с запятыми, и мне нужно было переформатировать ее в строки. Благодарю.
Aquarelle 06 май 2014, в 21:58
0

В этом сценарии это сработало -> "echo" $ SPLIT_0 "| awk -F 'inode =' '{print $ 1}'"! У меня возникли проблемы при попытке использовать символы ("inode =") вместо символов (";"). $ 1, $ 2, $ 3, $ 4 устанавливаются как позиции в массиве! Если есть способ установить массив ... лучше! Спасибо!
Eduardo Lucio 05 авг. 2015, в 12:59
0

@EduardoLucio, я думаю о том, что вы можете сначала заменить свой разделитель inode= на ; например, с помощью sed -i 's/inode\=/\;/g' your_file_to_process , затем определить -F';' Когда примените awk , надеюсь, что это поможет вам.
Tony 06 авг. 2015, в 02:42

Показать ещё 2 комментария

25

Другой подход к Darron answer, вот как я это делаю:

IN="[email protected];[email protected]"
read ADDR1 ADDR2 <<<$(IFS=";"; echo $IN)

nickjb 05 июль 2011, в 13:57

0

Это не работает
ColinM 10 сен. 2011, в 00:31
0

Я думаю, что это так! Запустите приведенные выше команды, а затем «echo $ ADDR1 ... $ ADDR2», и я получу вывод «[email protected] ... [email protected]»
nickjb 06 окт. 2011, в 15:33
1

Это работает очень хорошо для меня ... Я использовал его, чтобы перебрать массив строк, которые содержали разделенные запятыми данные DB, SERVER, PORT для использования mysqldump.
Nick 28 окт. 2011, в 14:36
5

Диагноз: IFS=";" присваивание существует только в подоболочке $(...; echo $IN) ; Вот почему некоторые читатели (включая меня) изначально думают, что это не сработает. Я предположил, что весь $ IN был подбит ADDR1. Но ник это правильно; это работает. Причина в том, что команда echo $IN анализирует свои аргументы, используя текущее значение $ IFS, но затем выводит их в стандартный вывод, используя разделитель пробелов, независимо от значения параметра $ IFS. Таким образом, чистый эффект такой, как если бы кто-то назвал read ADDR1 ADDR2 <<< "[email protected] [email protected]" (обратите внимание, что ввод не разделен пробелом; разделен пробелом).
dubiousjim 31 май 2012, в 05:28
0

Эта работа, но $() подразумевает разветвление.
F. Hauri 20 июль 2013, в 13:47
1

Это терпит неудачу на пробелах и символах новой строки, а также расширяет символы подстановки * в echo $IN с расширением без кавычек.
sorontar 26 окт. 2016, в 04:43
0

Мне очень нравится это решение. Описание того, почему это работает, было бы очень полезно и сделало бы его лучший общий ответ.
Michael Gaskill 30 янв. 2017, в 02:28

Показать ещё 5 комментариев

23

Это должно работать везде:

echo "luke;yoda;leila" | tr ";" "\n"

(Обратите внимание, что этот метод стоит того, если вы новичок в Bash, и вам просто нужен простой и короткий трюк. Академический и "правильный" способ заключается в использовании IFS, как указано в других сообщениях.)

Avt'W 03 дек. 2017, в 01:39

22

В Bash, пуленепробиваемый способ, который будет работать, даже если ваша переменная содержит символы новой строки:

IFS=';' read -d '' -ra array < <(printf '%s;\0' "$in")

Облик:

$ in=$'one;two three;*;there is\na newline\nin this field'
$ IFS=';' read -d '' -ra array < <(printf '%s;\0' "$in")
$ declare -p array
declare -a array='([0]="one" [1]="two three" [2]="*" [3]="there is
a newline
in this field")'

Трюк для этого заключается в использовании опции -d read (разделитель) с пустым разделителем, так что read вынужден читать все, что он кормил. И мы корнем read с точностью до содержимого переменной in, без конечной новой строки благодаря printf. Обратите внимание, что мы также помещаем разделитель в printf, чтобы гарантировать, что строка, переданная в read, имеет трейлинг-разделитель. Без него read обрезает потенциальные конечные пустые поля:

$ in='one;two;three;'    # there an empty field
$ IFS=';' read -d '' -ra array < <(printf '%s;\0' "$in")
$ declare -p array
declare -a array='([0]="one" [1]="two" [2]="three" [3]="")'

сохраняется оставшееся пустое поле.

Обновление для Bash ≥4.4

Так как Bash 4.4, встроенный mapfile (aka readarray) поддерживает параметр -d для указания разделителя. Следовательно, другой канонический способ:

mapfile -d ';' -t array < <(printf '%s;' "$in")

gniourf_gniourf 26 июнь 2014, в 10:05

5

Я нашел его как редкое решение в этом списке, которое корректно работает с \n , пробелами и * одновременно. Также нет петель; Переменная массива доступна в оболочке после выполнения (в отличие от ответа с наибольшим количеством голосов). Обратите внимание, что in=$'...' он не работает с двойными кавычками. Я думаю, что нужно больше голосов.
John_West 08 янв. 2016, в 12:10

18

Как насчет этого одного лайнера, если вы не используете массивы:

IFS=';' read ADDR1 ADDR2 <<<$IN

Darron 13 сен. 2010, в 20:54

0

Попробуйте использовать read -r ... чтобы, например, два символа "\ t" во входных данных оказались одинаковыми двумя символами в ваших переменных (вместо одного символа табуляции).
dubiousjim 31 май 2012, в 05:36
0

-1 Это не работает здесь (Ubuntu 12.04). Добавление echo "ADDR1 $ADDR1"\n echo "ADDR2 $ADDR2" к вашему фрагменту приведет к выводу ADDR1 [email protected] [email protected]\nADDR2 (\ n - ADDR1 [email protected] [email protected]\nADDR2 )
Luca Borrione 03 сен. 2012, в 10:07
0

Вероятно, это связано с ошибкой, связанной с IFS и здесь строками, которая была исправлена в bash 4.3. Цитирование $IN должно исправить это. (Теоретически, $IN не подлежит разделению или смещению слова после его расширения, что означает, что кавычки не должны быть необходимыми. Даже в 4.3, тем не менее, остается по крайней мере одна ошибка - сообщается и планируется исправить, - поэтому цитирование остается хорошая идея.)
chepner 19 сен. 2015, в 13:59
0

Это ломается, если $ in содержит символы новой строки, даже если $ IN указан в кавычках. И добавляет завершающий перевод строки.
sorontar 26 окт. 2016, в 04:55

Показать ещё 2 комментария

16

Без настройки IFS

Если у вас есть только один двоеточие, вы можете это сделать:

a="foo:bar"
b=${a%:*}
c=${a##*:}

вы получите:

b = foo
c = bar

Emilien Brigand 01 авг. 2016, в 14:24

14

Вот чистый 3-лайнер:

in="foo@bar;bizz@buzz;fizz@buzz;buzz@woof"
IFS=';' list=($in)
for item in "${list[@]}"; do echo $item; done

где IFS разграничивает слова на основе разделителя, а () используется для создания array. Затем [@] используется для возврата каждого элемента в виде отдельного слова.

Если после этого у вас есть какой-либо код, вам также необходимо восстановить $IFS, например. unset IFS.

kenorb 11 сен. 2015, в 21:49

4

Использование $in кавычках позволяет расширять символы подстановки.
sorontar 26 окт. 2016, в 05:03

7

Существует простой и понятный способ:

echo "add:sfff" | xargs -d: -i  echo {}

Но вы должны использовать gnu xargs, BSD xargs can not support -d delim. Если вы используете яблочный mac, как я. Вы можете установить gnu xargs:

brew install findutils

затем

echo "add:sfff" | gxargs -d: -i  echo {}

Victor Choy 16 сен. 2015, в 04:35

4

Следующая функция Bash/zsh разделяет свой первый аргумент на разделителе, заданном вторым аргументом:

split() {
    local string="$1"
    local delimiter="$2"
    if [ -n "$string" ]; then
        local part
        while read -d "$delimiter" part; do
            echo $part
        done <<< "$string"
        echo $part
    fi
}

Например, команда

$ split 'a;b;c' ';'

дает

a
b
c

Этот вывод может, например, быть передан в другие команды. Пример:

$ split 'a;b;c' ';' | cat -n
1   a
2   b
3   c

По сравнению с другими полученными решениями, это имеет следующие преимущества:

IFS не переопределяется: из-за динамического охвата четных локальных переменных переопределение IFS по циклу заставляет новое значение протекать в вызовы функций, выполняемые внутри цикла.
Массивы не используются: чтение строки в массив с использованием read требует наличия флага -a в Bash и -a в zsh.

При желании функцию можно поместить в script следующим образом:

#!/usr/bin/env bash

split() {
    # ...
}

split "$@"

Halle Knast 24 май 2017, в 08:52

0

работает и аккуратно модульный.
sandeepkunkunuru 23 окт. 2017, в 16:10

4

Это самый простой способ сделать это.

spo='one;two;three'
OIFS=$IFS
IFS=';'
spo_array=($spo)
IFS=$OIFS
echo ${spo_array[*]}

Prospero 25 сен. 2011, в 02:42

3

вы можете применить awk для многих ситуаций

echo "[email protected];[email protected]"|awk -F';' '{printf "%s\n%s\n", $1, $2}'

также вы можете использовать этот

echo "[email protected];[email protected]"|awk -F';' '{print $1,$2}' OFS="\n"

shuaihanhungry 20 янв. 2018, в 17:10

3

IN="[email protected];[email protected]"
IFS=';'
read -a IN_arr <<< "${IN}"
for entry in "${IN_arr[@]}"
do
    echo $entry
done

Выход

[email protected]
[email protected]

Система: Ubuntu 12.04.1

rashok 25 окт. 2016, в 12:45

0

IFS не устанавливается в конкретном контексте read здесь и, следовательно, он может расстроить остальную часть кода, если таковой имеется.
codeforester 02 янв. 2017, в 05:37

2

Если нет места, почему бы не это?

IN="[email protected];[email protected]"
arr=(`echo $IN | tr ';' ' '`)

echo ${arr[0]}
echo ${arr[1]}

ghost 24 апр. 2013, в 13:31

2

Здесь есть несколько интересных ответов (ошибочный вариант), но для чего-то аналогичного расколу на других языках - вот что я понял в исходном вопросе - я решил:

IN="[email protected];[email protected]"
declare -a a="(${IN/;/ })";

Теперь ${a[0]}, ${a[1]} и т.д., как и следовало ожидать. Используйте ${#a[*]} для количества терминов. Или, конечно же, повторить:

for i in ${a[*]}; do echo $i; done

ВАЖНОЕ ПРИМЕЧАНИЕ:

Это работает в тех случаях, когда нет проблем, о которых можно было бы беспокоиться, что решило мою проблему, но может не решить вашу проблему. Пойдите с решением $IFS в этом случае.

eukras 22 окт. 2012, в 08:22

0

Не работает, если IN содержит более двух адресов электронной почты. Пожалуйста, обратитесь к той же идее (но исправлено) в ответе Палиндрома
olibre 07 окт. 2013, в 13:33
0

Лучше использовать ${IN//;/ } (двойная косая черта), чтобы он также работал с более чем двумя значениями. Помните, что любой подстановочный знак ( *?[ ) Будет раскрыт. И конечное пустое поле будет отброшено.
sorontar 26 окт. 2016, в 05:14

1

Хорошо, ребята!

Вот мой ответ!

DELIMITER_VAL='='

read -d '' F_ABOUT_DISTRO_R <<"EOF"
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=14.04
DISTRIB_CODENAME=trusty
DISTRIB_DESCRIPTION="Ubuntu 14.04.4 LTS"
NAME="Ubuntu"
VERSION="14.04.4 LTS, Trusty Tahr"
ID=ubuntu
ID_LIKE=debian
PRETTY_NAME="Ubuntu 14.04.4 LTS"
VERSION_ID="14.04"
HOME_URL="http://www.ubuntu.com/"
SUPPORT_URL="http://help.ubuntu.com/"
BUG_REPORT_URL="http://bugs.launchpad.net/ubuntu/"
EOF

SPLIT_NOW=$(awk -F$DELIMITER_VAL '{for(i=1;i<=NF;i++){printf "%s\n", $i}}' <<<"${F_ABOUT_DISTRO_R}")
while read -r line; do
   SPLIT+=("$line")
done <<< "$SPLIT_NOW"
for i in "${SPLIT[@]}"; do
    echo "$i"
done

Почему этот подход для меня "лучший"?

Из-за двух причин:

Вам не нужно скрывать разделитель;
У вас не будет проблемы с пробелами. Значение будет правильно разделено в массиве!

[] 's

Eduardo Lucio 04 апр. 2016, в 20:01

0

FYI, /etc/os-release и /etc/lsb-release предназначены для получения, а не для анализа. Так что твой метод действительно неправильный. Более того, вы не совсем отвечаете на вопрос о том, как разбить строку на разделитель.
gniourf_gniourf 30 янв. 2017, в 08:26

1

В оболочке Android большинство предложенных методов просто не работают:

$ IFS=':' read -ra ADDR <<<"$PATH"                             
/system/bin/sh: can't create temporary file /sqlite_stmt_journals/mksh.EbNoR10629: No such file or directory

Что такое работа:

$ for i in ${PATH//:/ }; do echo $i; done
/sbin
/vendor/bin
/system/sbin
/system/bin
/system/xbin

где // означает глобальную замену.

18446744073709551615 20 фев. 2015, в 12:38

1

Сбой, если любая часть $ PATH содержит пробелы (или переводы строки). Также расширяются подстановочные знаки (звездочка *, знак вопроса? И фигурные скобки […]).
sorontar 26 окт. 2016, в 05:08

1

Помимо фантастических ответов, которые уже были предоставлены, если это просто вопрос распечатки данных, вы можете использовать awk:

awk -F";" '{for (i=1;i<=NF;i++) printf("> [%s]\n", $i)}' <<< "$IN"

Это устанавливает разделитель полей в ;, чтобы он мог проходить через поля с контуром for и печатать соответственно.

Test

$ IN="[email protected];[email protected]"
$ awk -F";" '{for (i=1;i<=NF;i++) printf("> [%s]\n", $i)}' <<< "$IN"
> [[email protected]]
> [[email protected]]

С другим вводом:

$ awk -F";" '{for (i=1;i<=NF;i++) printf("> [%s]\n", $i)}' <<< "a;b;c   d;e_;f"
> [a]
> [b]
> [c   d]
> [e_]
> [f]

fedorqui 08 янв. 2015, в 10:33

1

Две альтернативы bourne-ish, где не требуется bash массивы:

Случай 1: держите его красивым и простым: используйте NewLine в качестве разделителя записей... например.

IN="[email protected]
[email protected]"

while read i; do
  # process "$i" ... eg.
    echo "[email:$i]"
done <<< "$IN"

Примечание: в этом первом случае подпроцесс не используется для поддержки манипулирования списком.

Идея: Может быть, стоит использовать NL внутри себя и только преобразовывать в другой RS при создании окончательного результата извне.

Случай 2: использование символа ";" как разделитель записей... например.

NL="
" IRS=";" ORS=";"

conv_IRS() {
  exec tr "$1" "$NL"
}

conv_ORS() {
  exec tr "$NL" "$1"
}

IN="[email protected];[email protected]"
IN="$(conv_IRS ";" <<< "$IN")"

while read i; do
  # process "$i" ... eg.
    echo -n "[email:$i]$ORS"
done <<< "$IN"

В обоих случаях суб-список может быть составлен в цикле, является постоянным после завершения цикла. Это полезно при манипулировании списками в памяти, вместо этого хранения списков в файлах. {Приписка сохраняйте спокойствие и продолжайте B-)}

NevilleDNZ 02 сен. 2013, в 07:26

1

Используйте встроенный set для загрузки массива $@:

IN="[email protected];[email protected]"
IFS=';'; set $IN; IFS=$' \t\n'

Затем начнем вечеринку:

echo $#
for a; do echo $a; done
ADDR1=$1 ADDR2=$2

jeberle 30 апр. 2013, в 03:10

0

Лучше использовать set -- $IN чтобы избежать некоторых проблем с «$ IN», начинающимся с тире. Тем не менее, расширение без кавычек $IN будет расширять символы подстановки ( *?[ ).
sorontar 26 окт. 2016, в 05:17

0

Еще один поздний ответ... Если вы настроены на java, вот решение bashj (https://sourceforge.net/projects/bashj/):

#!/usr/bin/bashj

#!java

private static String[] cuts;
private static int cnt=0;
public static void split(String words,String regexp) {cuts=words.split(regexp);}
public static String next() {return(cnt<cuts.length ? cuts[cnt++] : "null");}

#!bash

IN="[email protected];[email protected]"

: j.split($IN,";")    # java method call

while true
do
    NAME=j.next()     # java method call
    if [ $NAME != null ] ; then echo $NAME ; else exit ; fi
done

Fil 13 июнь 2018, в 17:42

0

Возможно, это не самое элегантное решение, но работает с * и пробелами:

IN="bla@so me.com;*;[email protected]"
for i in `delims=${IN//[^;]}; seq 1 $((${#delims} + 1))`
do
   echo "> [`echo $IN | cut -d';' -f$i`]"
done

Выходы

> [bla@so me.com]
> [*]
> [[email protected]]

Другой пример (разделители в начале и в конце):

IN=";bla@so me.com;*;[email protected];"
> []
> [bla@so me.com]
> [*]
> [[email protected]]
> []

В основном он удаляет каждый символ, отличный от ;, делая delims, например. ;;;. Затем он выполняет цикл for от 1 до number-of-delimiters, как подсчитано ${#delims}. Последним шагом является безопасное получение $i -й части с помощью cut.

Petr Újezdský 26 фев. 2016, в 13:21

0

IN='[email protected];[email protected];Charlie Brown <[email protected];!"#$%&/()[]{}*? are no problem;simple is beautiful :-)'
set -f
oldifs="$IFS"
IFS=';'; arrayIN=($IN)
IFS="$oldifs"
for i in "${arrayIN[@]}"; do
echo "$i"
done
set +f

Вывод:

[email protected]
[email protected]
Charlie Brown <[email protected]
!"#$%&/()[]{}*? are no problem
simple is beautiful :-)

Объяснение: Простое назначение с помощью скобки() преобразует разделенный точкой с запятой список в массив, если у вас есть правильный IFS при этом. Стандартный цикл FOR обрабатывает отдельные элементы в этом массиве, как обычно. Обратите внимание, что список, указанный для переменной IN, должен быть "жестким", т.е. С одиночными тиками.

IFS необходимо сохранить и восстановить, так как Bash не относится к назначению так же, как и к команде. Альтернативное обходное решение состоит в том, чтобы обернуть назначение внутри функции и вызвать эту функцию с измененным IFS. В этом случае отдельное сохранение/восстановление IFS не требуется. Спасибо за "Bize" за указание на это.

ajaaskel 10 окт. 2014, в 13:21

0

!"#$%&/()[]{}*? are no problem ну ... не совсем: []*? являются символами глобуса. Так что насчет создания этого каталога и файла:` mkdir '! "# $% & '; коснитесь '! "# $% & / () [] {} получил хахахаха - не проблема» и запустил команду? простой может быть прекрасным, но когда он сломан, он сломан.
gniourf_gniourf 20 фев. 2015, в 16:45
0

@gniourf_gniourf Строка хранится в переменной. Пожалуйста, смотрите оригинальный вопрос.
ajaaskel 25 фев. 2015, в 07:20
1

@ajaaskel Вы не полностью поняли мой комментарий. Зайдите в каталог с нулями и введите следующие команды: mkdir '!"#$%&'; touch '!"#$%&/()[]{} got you hahahaha - are no problem' . Я должен признать, что они будут создавать только каталог и файл со странными названиями. Затем выполните свои команды с точным указанным IN : IN='[email protected];[email protected];Charlie Brown <[email protected];!"#$%&/()[]{}*? are no problem;simple is beautiful :-)' . Вы увидите, что вы не получите ожидаемого результата. Потому что вы используете метод, подверженный раскрытию пути, чтобы разбить вашу строку.
gniourf_gniourf 25 фев. 2015, в 07:26
0

Это чтобы продемонстрировать, что символы * ? , [...] и даже, если extglob установлено, !(...) , @(...) , ?(...) , +(...) проблемы с этим методом!
gniourf_gniourf 25 фев. 2015, в 07:29
0

Еще один аргумент против вашего метода для дороги: если кто-то использует этот метод с установленным nullglob или failglob , будут некоторые сюрпризы! Вы можете попробовать это: запустите ваш код с shopt -s nullglob а также с shopt -s failglob .
gniourf_gniourf 25 фев. 2015, в 07:31
1

@gniourf_gniourf Спасибо за подробные комментарии по поводу глобализации. Я изменил код, чтобы отключить. Моя цель была, однако, просто показать, что довольно простое назначение может сделать работу разделения.
ajaaskel 26 фев. 2015, в 15:26

Показать ещё 4 комментария

0

Однострочный разделитель строки, разделенной символом ';' в массив:

IN="[email protected];[email protected]"
ADDRS=( $(IFS=";" echo "$IN") )
echo ${ADDRS[0]}
echo ${ADDRS[1]}

Это только устанавливает IFS в подоболочку, поэтому вам не нужно беспокоиться о сохранении и восстановлении его значения.

Michael Hale 14 июнь 2012, в 18:19

0

-1 это не работает здесь (Ubuntu 12.04). он печатает только первый эхо со всеми значениями $ IN, в то время как второй пустой. Вы можете увидеть это, если поставить echo "0:" $ {ADDRS [0]} \ n echo "1:" $ {ADDRS [1]}, вывод 0: [email protected];[email protected]\n 1: (\ n - новая строка)
Luca Borrione 03 сен. 2012, в 10:04
1

пожалуйста, обратитесь к ответу nickjb для рабочей альтернативы этой идее stackoverflow.com/a/6583589/1032370
Luca Borrione 03 сен. 2012, в 10:05
1

-1, 1. IFS не устанавливается в этом подоболочке (он передается в среду "echo", которая является встроенной, поэтому в любом случае ничего не происходит). 2. $IN котируется, поэтому он не подлежит разделению IFS. 3. Подстановка процесса разделяется пробелами, но это может привести к повреждению исходных данных.
Score_Under 28 апр. 2015, в 17:09

Показать ещё 1 комментарий

-1

Вы также можете:

dirList=(
some
list
of
elements
)

for i in ${dirList[@]}; do
...
done

dmilith 03 дек. 2017, в 00:53

-7

Существует два простых метода:

cat "text1;text2;text3" | tr " " "\n"

и

cat "text1;text2;text3" | sed -e 's/ /\n/g'

ishtiyaq husain 12 окт. 2011, в 12:29

2

s / cat / echo / g charlimit
Thomas Dignan 11 июнь 2012, в 16:28
2

-1 Ошибка: cat: text1; text2; text3: нет такого файла или каталога
Luca Borrione 03 сен. 2012, в 10:03
2

Я думаю, что вы спутали cat и echo . cat читает из файлов. echo читает текст, данный.
daboross 29 июнь 2013, в 20:58

Показать ещё 1 комментарий

Ещё вопросы

Что касается вашего «Edit2»: вы можете просто «сбросить IFS», и он вернется в состояние по умолчанию. Нет необходимости сохранять и восстанавливать его явно, если только у вас нет причин ожидать, что для него уже установлено значение, отличное от значения по умолчанию. Более того, если вы делаете это внутри функции (а если нет, то почему бы и нет?), Вы можете установить IFS в качестве локальной переменной, и он вернется к своему предыдущему значению после выхода из функции.
@BrooksMoses: (a) +1 за использование local IFS=... где это возможно; (b) -1 для unset IFS , это точно не сбрасывает IFS к его значению по умолчанию, хотя я считаю, что неустановленный IFS ведет себя так же, как и значение по умолчанию IFS ($ '\ t \ n'), однако это кажется плохим практикуйте слепое предположение, что ваш код никогда не будет вызываться с IFS, установленным в произвольное значение; (c) другая идея состоит в том, чтобы вызвать подоболочку: (IFS=$custom; ...) при выходе из подоболочки IFS вернется к тому, что было изначально.
Я просто хочу быстро взглянуть на пути, чтобы решить, куда бросить исполняемый файл, поэтому я прибег к запуску ruby -e "puts ENV.fetch('PATH').split(':')" . Если вы хотите остаться чистым, bash не поможет, но проще использовать любой язык сценариев со встроенным разделением.
Это своего рода комментарий на диске, но, поскольку OP использовал адреса электронной почты в качестве примера, кто-нибудь удосужился ответить на него так, чтобы он полностью соответствовал RFC 5322, а именно, что любая строка в кавычках может появляться перед @, что означает, что вы Вам понадобятся регулярные выражения или какой-то другой вид парсера вместо наивного использования IFS или других упрощенных функций сплиттера.
Чтобы сохранить его в виде массива, я должен был поставить еще один набор скобок и изменить \n просто на пробел. Поэтому последняя строка - это mails=($(echo $IN | tr ";" " ")) . Так что теперь я могу проверять элементы mails с помощью массива нотации mails[index] или просто повторяя цикл
Для чего стоит, решение tr не работает так же, как в zsh.
Я просто хочу добавить: это самый простой из всех, вы можете получить доступ к элементам массива с помощью $ {arrIN [1]} (конечно, начиная с нулей)
Нашел его: техника изменения переменной внутри $ {} известна как «расширение параметров».
Если вы хотите разделить специальный символ, такой как тильда (~), убедитесь, что вы его не указали: arrIN = ($ {IN // \ ~ /})
Работает ли это, когда исходная строка содержит пробелы?
Нет, я не думаю, что это работает, когда присутствуют также пробелы ... это преобразование ',' в '', а затем построение массива, разделенного пробелами.
Очень краткий, но есть предостережения для общего использования : оболочка применяет разбиение слов и расширения к строке, что может быть нежелательным; просто попробуйте. IN="[email protected];[email protected];*;broken apart" . Вкратце: этот подход сломается, если ваши токены содержат встроенные пробелы и / или символы. такие как * которые случаются, чтобы токен совпадал с именами файлов в текущей папке.
Это плохой подход по другим причинам: например, если ваша строка содержит ;*; , тогда * будет расширен до списка имен файлов в текущем каталоге. -1
На самом деле вы можете исправить проблему с пробелами, используя IFS вместо расширения / замены параметров: IFS=':' arrIN=($IN) Это также несколько более читабельно, на мой взгляд.
@KyleStrand Это устанавливает IFS , а затем устанавливает arrIN , как если бы они были выполнены в отдельных строках или разделены arrIN a ; , То есть назначения являются временными, только если они появляются перед командой без назначения. Поэтому после IFS=':' arrIN=($IN) , echo "$IFS" дает : и слова разделяются на : для последующих команд, которые обычно не нужны. (Это легко пропустить, так как echo $var достаточно, чтобы проверить, является ли $var : когда : нет в $IFS .) Поэтому, за исключением, возможно, самого конца сценария, IFS=':' arrIN=($IN) IFS=$' \t\n' или IFS=':' arrIN=($IN); unset IFS является предпочтительным.
@EliahKagan Ах. Есть ли какая-то польза от этого конкретного несоответствия?
@KyleStrand Да, в том смысле, что, хотя имеет смысл область назначения переменной для команды, на самом деле не имеет смысла ограничивать область назначения одной переменной другой. Оболочка выполняет расширение переменных / параметров перед тем, как присваивать значения (или запускать команды). Например, x=foo echo $x не выводит foo , так как $x раскрывается до того, как foo назначается для x или запускается echo . Аналогично, если x=foo y=$x должны были назначить foo для x только тогда , когда y=$x побежал, то y будет присвоен оригинальный $x (не foo ) , потому что $x будет расширяться , прежде чем какие - либо переменные задания произошло.
@CharlesDuffy Этого можно избежать с помощью set -f : set -f; IN="[email protected];*;[email protected]"; arrIN=(${IN//;/ }); echo ${arrIN[1]}
@John_West, да, этот подход можно использовать, изменив глобальное состояние, чтобы отключить глобализацию (и взять под строгий контроль дальнейшее глобальное состояние в форме IFS ), но ... ну, зачем вам это делать, когда read -a доступны без каких-либо рисков?
@ Спасибо за то, что указали на проблему с наличием пробелов, и я удивлен, что этот вопрос не был в ответе. Я взял на себя смелость отредактировать ответ, чтобы упомянуть эту ошибку и найти решение для нее (и еще одной ошибки). (@EliahKagan спасибо за хорошее решение, которое согласуется с первоначальным ответом.)
Не уверен, почему IFS=';' declare -a arr=($IN) не получает больше кредита здесь. Нет необходимости устанавливать какие-либо промежуточные переменные, изменение IFS относится только к одной команде declare , и мы расширяем IFS, а не заменяем его другим.
Не должен IFS=':'; быть IFS=';'; соответствовать входной строке? в последнем примере
Почему синтаксис arrIN=(${IN//;/ }) когда помещается в цикл for в скрипте bash?
Вы должны были сохранить ответ IFS. Это научило меня чему-то, чего я не знал, и определенно создал массив, тогда как это просто дешевая замена.
Понимаю. Да, я нахожу себя в этих глупых экспериментах, я буду учиться чему-то новому каждый раз, когда пытаюсь что-то ответить. Я отредактировал материал, основанный на обратной связи #bash IRC и восстановленный :)
-1, вы явно не знаете о разбиении слов, потому что это вносит две ошибки в ваш код. Один - когда вы не заключаете в кавычки $ IN, а другой - когда вы притворяетесь, что новая строка - единственный разделитель, используемый в разделении слов. Вы перебираете каждое слово в IN, а не каждую строку, и ОПРЕДЕЛЕННО не каждый элемент, разделенный точкой с запятой, хотя может показаться, что побочный эффект выглядит так, как будто он работает.
Вы можете изменить его на эхо "$ IN" | tr ';' '\ n' | пока читаешь -r ADDY; do # process "$ ADDY"; Я думаю, что это сделано для того, чтобы ему повезло. Обратите внимание, что это приведет к развороту, и вы не сможете изменить внешние переменные внутри цикла (поэтому я использовал синтаксис <<< "$ IN"), а затем
Подводя итоги дискуссии в комментариях: Предостережения для общего пользования : оболочка применяет разбиение слов и расширения к строке, что может быть нежелательным; просто попробуйте. IN="[email protected];[email protected];*;broken apart" . Вкратце: этот подход сломается, если ваши токены содержат встроенные пробелы и / или символы. такие как * которые случаются, чтобы токен совпадал с именами файлов в текущей папке.
Это очень полезный ответ. например, IN=abc;def;123 . Как мы можем также напечатать номер индекса? echo $count $i ?
Подстановки # , ## , % и %% имеют то, что IMO проще запомнить (насколько они удаляются): # и % удаляют самую короткую подходящую строку, а ## и %% удаляют самую длинную из возможных.
IFS=\; read -a fields <<<"$var" завершается с ошибкой на новых строках и добавляет завершающий перевод на новую строку. Другое решение удаляет завершающее пустое поле.
Разделитель оболочки - самый элегантный ответ, точка.
Может ли последняя альтернатива использоваться со списком разделителей полей, установленным где-то еще? Например, я имею в виду использовать его в качестве сценария оболочки и передавать список разделителей полей в качестве позиционного параметра.
Да, в цикле: for sep in "#" "ł" "@" ; do ... var="${var#*$sep}" ...
Слава за использование cut , это правильный инструмент для работы! Очищено намного больше, чем любой из этих взломов.
Этот подход будет работать, только если вы заранее знаете количество элементов; вам нужно запрограммировать немного логики вокруг него. Он также запускает внешний инструмент для каждого элемента.
Как я искал, пытаясь избежать пустой строки в CSV. Теперь я могу указать точное значение столбца. Работа с IFS уже используется в цикле. Лучше, чем ожидалось для моей ситуации.
+1 ... но я бы не назвал переменную "Массив" ... пэт пев, наверное. Хорошее решение
+1 ... но "установить" и объявить -a не нужны. Вы могли бы также использовать только IFS";" && Array=($IN)
+1 Только примечание: не рекомендуется ли сохранить старый IFS, а затем восстановить его? (как показывает stefanB в его edit3) люди, приземляющиеся здесь (иногда просто копирующие и вставляющие решение), могут не думать об этом
-1: во-первых, @ata прав, что большинство команд в этом ничего не делают. Во-вторых, он использует расщепление слов для формирования массива и не делает ничего, чтобы запретить глобальное расширение при этом (поэтому, если у вас есть символы глобуса в любом из элементов массива, эти элементы заменяются соответствующими именами файлов).
Предложите использовать $'...' : IN=$'[email protected];[email protected];bet <d@\ns* kl.com>' . Затем echo "${Array[2]}" выведет строку с символом новой строки. set -- "$IN" также необходим в этом случае. Да, чтобы предотвратить глобальное расширение, решение должно включать set -f .
Cut работает только с одним символом в качестве разделителя.
Хотя он работает только с одним символом-разделителем, это то, что ищет OP (записи, разделенные точкой с запятой).
-1 что если строка содержит пробелы? например IN="this is first line; this is second line" arrIN=( $( echo "$IN" | sed -e 's/;/\n/g' ) ) создаст массив из 8 элементов в этом case (элемент для каждого слова разделен пробелом), а не 2 (элемент для каждой строки разделен точкой с запятой)
@ Luca Нет, скрипт sed создает ровно две строки. То, что создает несколько записей для вас, это когда вы помещаете их в массив bash (который по умолчанию разделяется на пробелы)
В том-то и дело: OP должен хранить записи в массиве, чтобы зацикливаться на нем, как вы можете видеть в его правках. Я думаю, что ваш (хороший) ответ упущен для упоминания об использовании arrIN=( $( echo "$IN" | sed -e 's/;/\n/g' ) ) для достижения этого, а также о совете изменить IFS на IFS=$'\n' для тех, кто приземлится здесь в будущем и должен разбить строку, содержащую пробелы. (и восстановить его потом). :)
@ Лука Хороший вопрос. Однако, когда я написал этот ответ, назначения массива не было в первоначальном вопросе.
Вы можете использовать -s, чтобы избежать упомянутой проблемы: superuser.com/questions/896800/… "-f, --fields = LIST выбрать только эти поля; также вывести любую строку, которая не содержит символа-разделителя, если опция -s не указано»
Или еще проще: echo "[email protected]; [email protected]" | awk 'BEGIN {RS = ";"} {print}'
@Jaro Это отлично сработало, когда у меня была строка с запятыми, и мне нужно было переформатировать ее в строки. Благодарю.
В этом сценарии это сработало -> "echo" $ SPLIT_0 "| awk -F 'inode =' '{print $ 1}'"! У меня возникли проблемы при попытке использовать символы ("inode =") вместо символов (";"). $ 1, $ 2, $ 3, $ 4 устанавливаются как позиции в массиве! Если есть способ установить массив ... лучше! Спасибо!
@EduardoLucio, я думаю о том, что вы можете сначала заменить свой разделитель inode= на ; например, с помощью sed -i 's/inode\=/\;/g' your_file_to_process , затем определить -F';' Когда примените awk , надеюсь, что это поможет вам.
Я думаю, что это так! Запустите приведенные выше команды, а затем «echo $ ADDR1 ... $ ADDR2», и я получу вывод «[email protected] ... [email protected]»
Это работает очень хорошо для меня ... Я использовал его, чтобы перебрать массив строк, которые содержали разделенные запятыми данные DB, SERVER, PORT для использования mysqldump.
Диагноз: IFS=";" присваивание существует только в подоболочке $(...; echo $IN) ; Вот почему некоторые читатели (включая меня) изначально думают, что это не сработает. Я предположил, что весь $ IN был подбит ADDR1. Но ник это правильно; это работает. Причина в том, что команда echo $IN анализирует свои аргументы, используя текущее значение $ IFS, но затем выводит их в стандартный вывод, используя разделитель пробелов, независимо от значения параметра $ IFS. Таким образом, чистый эффект такой, как если бы кто-то назвал read ADDR1 ADDR2 <<< "[email protected] [email protected]" (обратите внимание, что ввод не разделен пробелом; разделен пробелом).
Эта работа, но $() подразумевает разветвление.
Это терпит неудачу на пробелах и символах новой строки, а также расширяет символы подстановки * в echo $IN с расширением без кавычек.
Мне очень нравится это решение. Описание того, почему это работает, было бы очень полезно и сделало бы его лучший общий ответ.
Я нашел его как редкое решение в этом списке, которое корректно работает с \n , пробелами и * одновременно. Также нет петель; Переменная массива доступна в оболочке после выполнения (в отличие от ответа с наибольшим количеством голосов). Обратите внимание, что in=$'...' он не работает с двойными кавычками. Я думаю, что нужно больше голосов.
Попробуйте использовать read -r ... чтобы, например, два символа "\ t" во входных данных оказались одинаковыми двумя символами в ваших переменных (вместо одного символа табуляции).
-1 Это не работает здесь (Ubuntu 12.04). Добавление echo "ADDR1 $ADDR1"\n echo "ADDR2 $ADDR2" к вашему фрагменту приведет к выводу ADDR1 [email protected] [email protected]\nADDR2 (\ n - ADDR1 [email protected] [email protected]\nADDR2 )
Вероятно, это связано с ошибкой, связанной с IFS и здесь строками, которая была исправлена в bash 4.3. Цитирование $IN должно исправить это. (Теоретически, $IN не подлежит разделению или смещению слова после его расширения, что означает, что кавычки не должны быть необходимыми. Даже в 4.3, тем не менее, остается по крайней мере одна ошибка - сообщается и планируется исправить, - поэтому цитирование остается хорошая идея.)
Это ломается, если $ in содержит символы новой строки, даже если $ IN указан в кавычках. И добавляет завершающий перевод строки.
Использование $in кавычках позволяет расширять символы подстановки.
IFS не устанавливается в конкретном контексте read здесь и, следовательно, он может расстроить остальную часть кода, если таковой имеется.
Не работает, если IN содержит более двух адресов электронной почты. Пожалуйста, обратитесь к той же идее (но исправлено) в ответе Палиндрома
Лучше использовать ${IN//;/ } (двойная косая черта), чтобы он также работал с более чем двумя значениями. Помните, что любой подстановочный знак ( *?[ ) Будет раскрыт. И конечное пустое поле будет отброшено.
FYI, /etc/os-release и /etc/lsb-release предназначены для получения, а не для анализа. Так что твой метод действительно неправильный. Более того, вы не совсем отвечаете на вопрос о том, как разбить строку на разделитель.
Сбой, если любая часть $ PATH содержит пробелы (или переводы строки). Также расширяются подстановочные знаки (звездочка *, знак вопроса? И фигурные скобки […]).
Лучше использовать set -- $IN чтобы избежать некоторых проблем с «$ IN», начинающимся с тире. Тем не менее, расширение без кавычек $IN будет расширять символы подстановки ( *?[ ).
!"#$%&/()[]{}*? are no problem ну ... не совсем: []*? являются символами глобуса. Так что насчет создания этого каталога и файла:` mkdir '! "# $% & '; коснитесь '! "# $% & / () [] {} получил хахахаха - не проблема» и запустил команду? простой может быть прекрасным, но когда он сломан, он сломан.
@gniourf_gniourf Строка хранится в переменной. Пожалуйста, смотрите оригинальный вопрос.
@ajaaskel Вы не полностью поняли мой комментарий. Зайдите в каталог с нулями и введите следующие команды: mkdir '!"#$%&'; touch '!"#$%&/()[]{} got you hahahaha - are no problem' . Я должен признать, что они будут создавать только каталог и файл со странными названиями. Затем выполните свои команды с точным указанным IN : IN='[email protected];[email protected];Charlie Brown <[email protected];!"#$%&/()[]{}*? are no problem;simple is beautiful :-)' . Вы увидите, что вы не получите ожидаемого результата. Потому что вы используете метод, подверженный раскрытию пути, чтобы разбить вашу строку.
Это чтобы продемонстрировать, что символы * ? , [...] и даже, если extglob установлено, !(...) , @(...) , ?(...) , +(...) проблемы с этим методом!
Еще один аргумент против вашего метода для дороги: если кто-то использует этот метод с установленным nullglob или failglob , будут некоторые сюрпризы! Вы можете попробовать это: запустите ваш код с shopt -s nullglob а также с shopt -s failglob .
@gniourf_gniourf Спасибо за подробные комментарии по поводу глобализации. Я изменил код, чтобы отключить. Моя цель была, однако, просто показать, что довольно простое назначение может сделать работу разделения.
-1 это не работает здесь (Ubuntu 12.04). он печатает только первый эхо со всеми значениями $ IN, в то время как второй пустой. Вы можете увидеть это, если поставить echo "0:" $ {ADDRS [0]} \ n echo "1:" $ {ADDRS [1]}, вывод 0: [email protected];[email protected]\n 1: (\ n - новая строка)
пожалуйста, обратитесь к ответу nickjb для рабочей альтернативы этой идее stackoverflow.com/a/6583589/1032370
-1, 1. IFS не устанавливается в этом подоболочке (он передается в среду "echo", которая является встроенной, поэтому в любом случае ничего не происходит). 2. $IN котируется, поэтому он не подлежит разделению IFS. 3. Подстановка процесса разделяется пробелами, но это может привести к повреждению исходных данных.
-1 Ошибка: cat: text1; text2; text3: нет такого файла или каталога
Я думаю, что вы спутали cat и echo . cat читает из файлов. echo читает текст, данный.

Johannes Schaub - litb · Accepted Answer · 2009-05-28T03-06-00.000Z

877

Лучший ответ

Вы можете установить переменную internal field separator (IFS), а затем разрешить ее анализировать в массив. Когда это происходит в команде, тогда назначение IFS происходит только в этой среде с одной командой (до read). Затем он анализирует вход в соответствии с значением переменной IFS в массив, который затем мы можем перебрать.

IFS=';' read -ra ADDR <<< "$IN"
for i in "${ADDR[@]}"; do
    # process "$i"
done

Он проанализирует одну строку элементов, разделенных ;, нажав ее в массив. Материал для обработки всего $IN, каждый раз, когда одна строка ввода разделяется символом ;:

 while IFS=';' read -ra ADDR; do
      for i in "${ADDR[@]}"; do
          # process "$i"
      done
 done <<< "$IN"

Johannes Schaub - litb 28 май 2009, в 03:06

17

Это, наверное, лучший способ. Как долго IFS сохранит свое текущее значение, сможет ли он испортить мой код, будучи установленным, когда его не должно быть, и как я могу сбросить его, когда я закончу с этим?
Chris Lutz 28 май 2009, в 02:25
6

теперь, после исправления, только в течение действия команды чтения :)
Johannes Schaub - litb 28 май 2009, в 03:04
1

Я знал, что есть способ с массивами, просто не мог вспомнить, что это было. Мне нравится устанавливать IFS, но я не уверен с редиректом от $ IN и перехожу на чтение только для заполнения массива. Не проще ли восстановить IFS? В любом случае +1 за предложение IFS, спасибо.
stefanB 28 май 2009, в 03:11
1

Мне не понравилось это сохранено = "$ IFS"; КСФ = ';'; ADDR = ($ В); IFS = "$ сохранено" беспорядок. :)
Johannes Schaub - litb 28 май 2009, в 03:14
14

Вы можете читать все сразу, не используя цикл while: read -r -d '' -a addr <<< "$ in" # Ключ -d здесь - это ключ, он сообщает read не останавливаться на первой новой строке ( который является значением по умолчанию -d), но продолжается до EOF или пустого байта (который встречается только в двоичных данных).
lhunath 28 май 2009, в 06:14
0

lhunath, ах хорошая идея :) Однако, когда я говорю «-d», он всегда добавляет перевод строки как последний элемент в массив. Я не знаю, почему это так :(
Johannes Schaub - litb 28 май 2009, в 15:23
1

Мне кажется, естественное решение проблемы разбиения строки в bash с помощью специального разделителя слов безопасным способом. Помоги мне очень.
Eduardo Lago Aguilar 08 сен. 2011, в 15:33
0

Почему бы не сделать это так, как я предложил? Я что-то пропустил?
Arcabard 25 сен. 2011, в 01:11
0

+1 Только примечание: не рекомендуется ли сохранить старый IFS, а затем восстановить его? (как показывает stefanB в его edit3) люди, приземляющиеся здесь (иногда просто копирующие и вставляющие решение), могут не думать об этом.
Luca Borrione 03 сен. 2012, в 09:23
41

@LucaBorrione Установка IFS в той же строке, что и read без точки с запятой или другого разделителя, в отличие от отдельной команды, определяет область действия этой команды - поэтому она всегда «восстанавливается»; вам не нужно ничего делать вручную.
Charles Duffy 06 июль 2013, в 14:39
0

Я заметил, что скобки нужны около $ IN. В противном случае вся строка помещается в ADDR [0]. Почему это так?
imagineerThat 09 янв. 2014, в 21:20
5

@imagineerThis Существует ошибка, связанная с приведенными здесь строками и локальными изменениями IFS, из-за которой требуется $IN для кавычек. Исправлена ошибка в bash 4.3.
chepner 02 окт. 2014, в 03:50
1

Не обрабатывает newline ( \n ) правильно, ни когда IN объявлен как IN=$'...' ни когда IN="..." . Чтобы увидеть это, попробуйте echo $i for loop или declare -p ADDR . Посмотрите это решение для обходного пути.
John_West 08 янв. 2016, в 12:03
3

Не обрабатывает включенные новые строки. Также добавьте завершающий перевод строки.
sorontar 26 окт. 2016, в 03:28
0

Это создает дополнительные пустые элементы массива, если строка для разделения имеет более одного символа.
ssc 07 дек. 2016, в 09:19
5

чтение -a не поддерживается в zsh :(
Tom 30 май 2017, в 16:17
0

@ JohannesSchaub-litb Удивительное решение. Выясняется, что в мире сценариев оболочки еще многое предстоит узнать :-)
helvete 19 янв. 2018, в 15:04

Показать ещё 15 комментариев