Перебирая содержимое файла в Bash

Question

Перебирая содержимое файла в Bash

997

Как мне перебрать каждую строку текстового файла с помощью Bash?

С помощью этого скрипта:

echo "Start!"
for p in (peptides.txt)
do
    echo "${p}"
done

Я получаю этот вывод на экране:

Start!
./runPep.sh: line 3: syntax error near unexpected token '('
./runPep.sh: line 3: 'for p in (peptides.txt)'

(Позже я хочу сделать что-то более сложное с $p чем просто выводить на экран.)

Переменная окружения SHELL (из env):

SHELL=/bin/bash

Вывод /bin/bash --version:

GNU bash, version 3.1.17(1)-release (x86_64-suse-linux-gnu)
Copyright (C) 2005 Free Software Foundation, Inc.

вывод cat/proc/version:

Linux version 2.6.18.2-34-default (geeko@buildhost) (gcc version 4.1.2 20061115 (prerelease) (SUSE Linux)) #1 SMP Mon Nov 27 11:46:27 UTC 2006

Файл peptides.txt содержит:

RKEKNVQ
IPKKLLQK
QYFHQLEKMNVK
IPKKLLQK
GDLSTALEVAIDCYEK
QYFHQLEKMNVKIPENIYR
RKEKNVQ
VLAKHGKLQDAIN
ILGFMK
LEDVALQILL

Peter Mortensen 05 окт. 2009, в 17:04

Источник

7

О, я вижу, что здесь произошло много вещей: все комментарии были удалены, и вопрос был вновь открыт. Просто для справки, принятый ответ в строке «Чтение файла», присваивающий значение переменной, решает проблему каноническим способом и должен быть предпочтительнее, чем принятый здесь.
fedorqui 30 авг. 2016, в 09:44

Теги:

bash

loops

linux

unix

io

11 ответов

324

cat peptides.txt | while read line
do
   # do something with $line here
done

Warren Young 05 окт. 2009, в 19:25

57

В общем, если вы используете «cat» только с одним аргументом, вы делаете что-то не так (или неоптимально).
JesperE 05 окт. 2009, в 18:02
0

Я попробовал это, и это работает (так же как и Бруно де Фрейн).
Peter Mortensen 05 окт. 2009, в 18:10
24

Да, это просто не так эффективно, как у Бруно, потому что запускает другую программу без необходимости. Если эффективность имеет значение, делай это Бруно. Я помню свой путь, потому что вы можете использовать его с другими командами, где синтаксис «перенаправление из» не работает.
Warren Young 05 окт. 2009, в 18:12
68

Есть еще одна, более серьезная проблема: поскольку цикл while является частью конвейера, он выполняется в подоболочке, и поэтому любые переменные, установленные внутри цикла, теряются при его выходе (см. Bash-hackers.org/wiki/doku. php / mirroring / bashfaq / 024 ). Это может быть очень раздражающим (в зависимости от того, что вы пытаетесь сделать в цикле).
Gordon Davisson 06 окт. 2009, в 00:57
1

@JesperE не могли бы вы разработать альтернативный пример?
Ogre Psalm33 21 нояб. 2011, в 16:35
1

@ Огре: Он имеет в виду, что вы должны делать это так, как Бруно сделал в своем принятом ответе. Оба работают. Путь Бруно немного эффективнее, так как он не запускает внешнюю команду для чтения файла. Если эффективность имеет значение, сделайте это Бруно. Если нет, то делайте это так, как вам будет удобно.
Warren Young 21 нояб. 2011, в 16:37
3

@ OgrePsalm33: Уоррен прав. Команда "cat" используется для объединения файлов. Если вы не объединяете файлы, скорее всего, вам не нужно использовать «cat».
JesperE 22 нояб. 2011, в 10:38
2

Хорошо, имеет смысл. Я хотел подчеркнуть это, потому что я вижу много чрезмерно используемых примеров в сценариях и тому подобном, где «cat» просто служит дополнительным шагом для получения содержимого одного файла.
Ogre Psalm33 22 нояб. 2011, в 21:43
20

Я использую "cat file |" как начало многих моих команд исключительно потому, что я часто создаю прототип с помощью "head file |"
mat kelcey 26 фев. 2014, в 21:33
3

@matkelcey Кроме того, как еще вы поместите весь файл в начало конвейера? Bash дает вам здесь строки, которые великолепны (особенно для таких вещей, как, например if grep -q 'findme' <<< "$var" ), но не переносимы, и я бы не хотел запускать большой конвейер с одним из них. Что-то вроде cat ifconfig.output | grep inet[^6] | grep -v '127.0.0.1' | awk '{print $2}' | cut -d':' -f2 легче читать, так как все следует слева направо. Это похоже на нажатие awk вместо cut потому что вам не нужны пустые токены - это своего рода злоупотребление командой, но это именно так и делается.
ACK_stoverflow 18 июнь 2014, в 19:25
44

Это может быть не так эффективно, но гораздо более читабельно, чем другие ответы.
Savage Reader 22 дек. 2014, в 13:02
2

+1 для читабельности, а также модульность - этот код можно легко поместить в более сложный конвейер, заменив 'cat ...' на вывод чего-то еще.
tishma 03 сен. 2015, в 09:59
2

Это намного лучше, чем Бруно написал. Это особенно полезно, когда данные создаются динамически командой. Используя решение Бруно, цикл получит любые данные после того, как команда будет полностью выполнена. Ваше решение дает результат команды на линии в цикл, не беря буфер из системы. например, замените 'cat peptides.txt' на 'find /', или в предыдущем решении 'done <peptides.txt' на 'done <$ (find /)'. он может не справиться с выполнением, поскольку существует вероятность переполнения буфера или использования всей памяти.
Znik 27 нояб. 2015, в 12:42
3

К тому времени, когда вы заботитесь о разнице в производительности, вы не будете задавать ТАК такие вопросы.
Ryan 28 фев. 2018, в 01:20
0

< peptides.txt | while read line...
Mike D 05 июнь 2018, в 14:09
0

Это, однако, отлично подходит для grep, sed или любых других манипуляций с текстом, предшествующих чтению.
Cory Ringdahl 29 авг. 2018, в 00:27
0

это не работает, если любая из команд внутри вашего цикла запускает команды через ssh; поток stdin используется (даже если ssh не использует его), и цикл завершается после первой итерации.
user5359531 12 нояб. 2018, в 22:58
1

@MikeD, это zsh-ism; это не работает в Bash.
Charles Duffy 30 нояб. 2018, в 03:08
0

Как и в принятом ответе, это будет иметь неприятные сюрпризы без read -r в некоторых угловых случаях. В основном всегда используйте read -r если вам не требуется специфическое поведение обычного read .
tripleee 30 янв. 2019, в 18:38

Показать ещё 17 комментариев

128

Вариант 1а: цикл "цикл": по одной строке: перенаправление ввода

#!/bin/bash
filename='peptides.txt'
echo Start
while read p; do 
    echo $p
done < $filename

Вариант 1b: цикл "цикл": одна строка за раз:
Откройте файл, прочитайте из файлового дескриптора (в данном случае файловый дескриптор # 4).

#!/bin/bash
filename='peptides.txt'
exec 4<$filename
echo Start
while read -u4 p ; do
    echo $p
done

Вариант 2. Для цикла: чтение файла в одну переменную и анализ.
Этот синтаксис будет анализировать "строки" на основе любого пробела между токенами. Это все еще работает, потому что указанные строки входного файла являются однословными токенами. Если бы в строке было больше одного токена, этот метод не работал бы. Кроме того, чтение полного файла в одну переменную не является хорошей стратегией для больших файлов.

#!/bin/bash
filename='peptides.txt'
filelines='cat $filename'
echo Start
for line in $filelines ; do
    echo $line
done

Stan Graves 05 окт. 2009, в 18:33

0

Для варианта 1b: нужно ли снова закрывать дескриптор файла? Например, петля может быть внутренней петлей.
Peter Mortensen 05 окт. 2009, в 20:03
3

Дескриптор файла будет очищен при выходе из процесса. Явное закрытие может быть сделано для повторного использования числа fd. Чтобы закрыть fd, используйте другой exec с синтаксисом &, например: exec 4 <& -
Stan Graves 05 окт. 2009, в 21:09
1

Спасибо за Вариант 2. Я столкнулся с огромными проблемами с Вариантом 1, потому что мне нужно было читать из stdin в цикле; в таком случае вариант 1 не будет работать.
masgo 04 июнь 2014, в 13:50
3

Вы должны более четко указать, что вариант 2 настоятельно не рекомендуется . @masgo Вариант 1b должен работать в этом случае, и его можно комбинировать с синтаксисом перенаправления ввода из Варианта 1a, заменяя done < $filename на done 4<$filename (что полезно, если вы хотите прочитать имя файла из параметра команды , в этом случае вы можете просто заменить $filename на $1 ).
Egor Hans 12 нояб. 2017, в 16:44
0

Мне нужно перебрать содержимое файла, например tail -n +2 myfile.txt | grep 'somepattern' | cut -f3 , при запуске команд ssh внутри цикла (использует stdin); Вариант 2 здесь, кажется, единственный путь?
user5359531 12 нояб. 2018, в 23:21

Показать ещё 3 комментария

64

Это не лучше, чем другие ответы, но это еще один способ получить работу в файле без пробелов (см. комментарии). Я нахожу, что мне часто нужны однострочники для прокрутки списков в текстовых файлах без дополнительного шага использования отдельных файлов script.

for word in $(cat peptides.txt); do echo $word; done

Этот формат позволяет мне помещать все это в одну командную строку. Измените часть "echo $word" на то, что вы хотите, и вы можете выпустить несколько команд, разделенных точками с запятой. Следующий пример использует содержимое файла как аргументы в двух других сценариях, которые вы, возможно, написали.

for word in $(cat peptides.txt); do cmd_a.sh $word; cmd_b.py $word; done

Или, если вы намереваетесь использовать это как редактор потока (learn sed), вы можете вывести вывод в другой файл следующим образом.

for word in $(cat peptides.txt); do cmd_a.sh $word; cmd_b.py $word; done > outfile.txt

Я использовал их как написано выше, потому что я использовал текстовые файлы, где я создал их по одному слову в строке. (См. Комментарии) Если у вас есть пробелы, которые вы не хотите разделить ваши слова/строки, он становится немного уродливым, но та же команда все еще работает следующим образом:

OLDIFS=$IFS; IFS=$'\n'; for line in $(cat peptides.txt); do cmd_a.sh $line; cmd_b.py $line; done > outfile.txt; IFS=$OLDIFS

Это просто говорит оболочке разделить только на новые строки, а не пробелы, а затем возвращает среду обратно к тому, что было ранее. На этом этапе вы можете захотеть поместить все это в оболочку script, а не сжать все это в одну строку.

Удачи!

mightypile 04 окт. 2013, в 15:17

0

Это не соответствует требованию (итерация по каждой строке), если файл содержит пробелы или символы табуляции, но может быть полезно, если вы хотите выполнить итерацию по каждому полю в файле, разделенном табуляцией / пробелом.
Joao Costa 30 окт. 2013, в 12:37
3

Bash $ (<peptides.txt), возможно, более элегантен, но все же неправильно, как правильно сказал Жоао, вы выполняете логику подстановки команд, где пробел или символ новой строки - это то же самое. Если в строке есть пробел, цикл выполняется ДВАЖДЫ или более для этой одной строки. Поэтому ваш код должен правильно читать: для слова в $ (<peptides.txt); делай .... Если ты точно знаешь, что пробелов нет, то строка равна слову, и ты в порядке.
maxpolk 08 дек. 2013, в 17:58
2

@ JoaoCosta, maxpolk: Хорошие моменты, которые я не учел. Я отредактировал оригинальный пост, чтобы отразить их. Спасибо!
mightypile 22 дек. 2013, в 15:49
2

Использование for делает входные токены / строки подчиненными расширениям оболочки, что обычно нежелательно; попробуйте это: for l in $(echo '* b c'); do echo "[$l]"; done - как вы увидите, * - хотя изначально он был заключен в кавычки - расширяется до файлов в текущем каталоге.
mklement0 22 дек. 2013, в 16:09
0

Не забудьте процитировать ваши "$word" и "$line" ...
Toby Speight 08 июнь 2015, в 16:34
0

Joao и maxpolk, вы решаете проблему, которая у меня есть, но я по-прежнему получаю отдельную итерацию для каждой половины каждой строки с пробелом:> cat linkedin_OSInt.txt linkedin.com/vsearch/f?type=all&keywords= "foo bar" linkedin.com/vsearch/f?type=all&keywords="baz bux "> для URL в $ (<linkedin_OSInt.txt); do echo "$ url"; done linkedin.com/vsearch/f?type=all&keywords="foo bar " linkedin.com/vsearch/f?type=all&keywords="baz bux" Я попробую другие подходы здесь, но хотел бы понять, почему этот не делает не работает
dblanchard 13 нояб. 2015, в 19:18
2

@dblanchard: последний пример, использующий $ IFS, должен игнорировать пробелы. Вы пробовали эту версию?
mightypile 24 нояб. 2015, в 00:53
0

пожалуйста, обратите внимание на изменение cat peptides.txt с помощью find /. цикл for не запустится до того, как завершится внутренняя кошка. между этими шагами возможно переполнение буфера.
Znik 27 нояб. 2015, в 12:44
2

То, как эта команда становится намного сложнее, когда решаются важные проблемы, очень хорошо показывает, почему использование for для итерации строк файла - плохая идея. Плюс аспект расширения, упомянутый @ mklement0 (даже если это возможно обойти, введя экранированные кавычки, что снова делает вещи более сложными и менее читаемыми).
Egor Hans 12 нояб. 2017, в 14:23
0

Это читаемый единственный ответ, который также читает последнюю строку файла, которая является про.
David Tabernero M. 07 июнь 2018, в 23:07

Показать ещё 8 комментариев

44

Используйте цикл while, например:

while IFS= read -r line; do
   echo "$line"
done <file

Примечания:

Если вы не установите IFS правильно, вы потеряете отступ.
Вы должны почти всегда использовать параметр -r при чтении.
Не читать строки с for

Jahid 09 июнь 2015, в 15:22

2

Почему опция -r ?
David C. Rankin 23 июнь 2015, в 02:31
2

@ DavidC.Rankin Опция -r предотвращает обратную косую черту. Note #2 является ссылкой, где это описано подробно ...
Jahid 23 июнь 2015, в 06:01
0

Объедините это с опцией «читать -u» в другом ответе, и тогда все будет идеально.
Florin Andrei 17 фев. 2017, в 00:06
0

@FlorinAndrei: В приведенном выше примере не нужна опция -u , вы говорите о другом примере с -u ?
Jahid 17 фев. 2017, в 05:37
0

Просматривал ваши ссылки и был удивлен, что нет ответа, который просто ссылается на вашу ссылку в Примечании 2. Эта страница содержит все, что вам нужно знать об этом предмете. Или ответы только для ссылок не рекомендуется?
Egor Hans 12 нояб. 2017, в 16:49
0

@EgorHans: ответы, содержащие только ссылки, как правило, удаляются.
Jahid 13 нояб. 2017, в 02:00
0

Ах. Хорошо, никогда не предлагать ответ только для ссылки. Может быть, даже были, мы никогда не узнаем.
Egor Hans 14 нояб. 2017, в 16:34

Показать ещё 5 комментариев

42

Еще несколько вещей, не охваченных другими ответами:

Чтение из файла с разделителями

# ':' is the delimiter here, and there are three fields on each line in the file
# IFS set below is restricted to the context of 'read', it doesn't affect any other code
while IFS=: read -r field1 field2 field3; do
  # process the fields
  # if the line has less than three fields, the missing fields will be set to an empty string
  # if the line has more than three fields, 'field3' will get all the values, including the third field plus the delimiter(s)
done < input.txt

Чтение из вывода другой команды, используя подстановку процесса

while read -r line; do
  # process the line
done < <(command ...)

Этот подход лучше, чем command... | while read -r line; do... command... | while read -r line; do... command... | while read -r line; do... потому что цикл while выполняется в текущей оболочке, а не в подоболочке, как в случае последней. См. Соответствующий пост . Переменная, измененная внутри цикла while, не запоминается.

Чтение с ввода с нулевым разделением, например, `find... -print0`

while read -r -d '' line; do
  # logic
  # use a second 'read ... <<< "$line"' if we need to tokenize the line
done < <(find /path/to/dir -print0)

Связанные чтения: BashFAQ/020 - Как я могу найти и безопасно обрабатывать имена файлов, содержащие переводы строк, пробелы или оба?

Чтение из более чем одного файла одновременно

while read -u 3 -r line1 && read -u 4 -r line2; do
  # process the lines
  # note that the loop will end when we reach EOF on either of the files, because of the '&&'
done 3< input1.txt 4< input2.txt

Основываясь на ответе @chepner здесь:

-u является расширением bash. Для совместимости с POSIX каждый вызов будет выглядеть примерно так: read -r X <&3.

Чтение всего файла в массив (версии Bash ранее до 4)

while read -r line; do
    my_array+=("$line")
done < my_file

Если файл заканчивается неполной строкой (в конце отсутствует новая строка), то:

while read -r line || [[ $line ]]; do
    my_array+=("$line")
done < my_file

Чтение всего файла в массив (версии Bash 4x и выше)

readarray -t my_array < my_file

или же

mapfile -t my_array < my_file

А потом

for line in "${my_array[@]}"; do
  # process the lines
done

Похожие сообщения:

codeforester 14 янв. 2017, в 03:42

0

обратите внимание, что вместо command < input_filename.txt вы всегда можете выполнить input_generating_command | command или command < <(input_generating_command)
masterxilo 07 март 2019, в 14:00

13

Если вы не хотите, чтобы ваше чтение было нарушено символом новой строки, используйте -

#!/bin/bash
while IFS='' read -r line || [[ -n "$line" ]]; do
    echo "$line"
done < "$1"

Затем запустите script с именем файла в качестве параметра.

Anjul Sharma 08 март 2016, в 18:04

11

Предположим, у вас есть этот файл:

$ cat /tmp/test.txt
Line 1
    Line 2 has leading space
Line 3 followed by blank line

Line 5 (follows a blank line) and has trailing space    
Line 6 has no ending CR

Существует четыре элемента, которые изменят значение вывода файла, читаемого многими решениями Bash:

Пустая строка 4;
Начальные или конечные пробелы в двух строках;
Сохранение значения отдельных строк (т.е. Каждая строка является записью);
Строка 6 не заканчивается символом CR.

Если вы хотите, чтобы текстовый файл построчно включал в себя пустые строки и завершающие строки без CR, вы должны использовать цикл while и у вас должен быть альтернативный тест для последней строки.

Вот методы, которые могут изменить файл (по сравнению с тем, что возвращает cat):

1) Потерять последнюю строку, а также начальные и конечные пробелы:

$ while read -r p; do printf "%s\n" "'$p'"; done </tmp/test.txt
'Line 1'
'Line 2 has leading space'
'Line 3 followed by blank line'
''
'Line 5 (follows a blank line) and has trailing space'

(Если вы делаете, while IFS= read -r p; do printf "%s\n" "'$p'"; done </tmp/test.txt, вы сохраняете пробелы в while IFS= read -r p; do printf "%s\n" "'$p'"; done </tmp/test.txt и в конце, но все равно теряете последний линия, если она не заканчивается CR)

2) Использование процесса подстановки с помощью cat приведет к считыванию всего файла одним глотком и потере значения отдельных строк:

$ for p in "$(cat /tmp/test.txt)"; do printf "%s\n" "'$p'"; done
'Line 1
    Line 2 has leading space
Line 3 followed by blank line

Line 5 (follows a blank line) and has trailing space    
Line 6 has no ending CR'

(Если вы удалите " из $(cat/tmp/test.txt) вы прочитаете файл слово за словом, а не одним глотком. Также, вероятно, не то, что предназначено...)

Самый надежный и простой способ прочитать файл построчно и сохранить все пробелы:

$ while IFS= read -r line || [[ -n $line ]]; do printf "'%s'\n" "$line"; done </tmp/test.txt
'Line 1'
'    Line 2 has leading space'
'Line 3 followed by blank line'
''
'Line 5 (follows a blank line) and has trailing space    '
'Line 6 has no ending CR'

Если вы хотите удалить ведущие и торговые пробелы, удалите часть IFS=:

$ while read -r line || [[ -n $line ]]; do printf "'%s'\n" "$line"; done </tmp/test.txt
'Line 1'
'Line 2 has leading space'
'Line 3 followed by blank line'
''
'Line 5 (follows a blank line) and has trailing space'
'Line 6 has no ending CR'

(Текстовый файл без завершающего \n, в то время как довольно часто, считается ломались под POSIX. Если вы можете рассчитывать на ведомой \n Вам не нужно || [[ -n $line ]] в while цикл.)

Больше на BASH FAQ

dawg 03 фев. 2016, в 21:01

0

Мой я спрашиваю, почему понизить?
dawg 04 нояб. 2018, в 16:30

4

#!/bin/bash
#
# Change the file name from "test" to desired input file 
# (The comments in bash are prefixed with #'s)
for x in $(cat test.txt)
do
    echo $x
done

Sine 14 нояб. 2013, в 14:53

6

Этот ответ нуждается в предостережениях, упомянутых в ответе mightypile , и он может потерпеть неудачу, если любая строка содержит метасимволы оболочки (из-за без кавычек "$ x").
Toby Speight 08 июнь 2015, в 16:32
6

Я на самом деле удивлен, что люди еще не придумали обычные Не читать строки для ...
Egor Hans 12 нояб. 2017, в 14:17

3

Вот мой пример реальной жизни, как петля строк другого выхода программы, проверка подстрок, сброс двойных кавычек из переменной, использование этой переменной за пределами цикла. Я думаю, что многие задают эти вопросы рано или поздно.

##Parse FPS from first video stream, drop quotes from fps variable
## streams.stream.0.codec_type="video"
## streams.stream.0.r_frame_rate="24000/1001"
## streams.stream.0.avg_frame_rate="24000/1001"
FPS=unknown
while read -r line; do
  if [[ $FPS == "unknown" ]] && [[ $line == *".codec_type=\"video\""* ]]; then
    echo ParseFPS $line
    FPS=parse
  fi
  if [[ $FPS == "parse" ]] && [[ $line == *".r_frame_rate="* ]]; then
    echo ParseFPS $line
    FPS=${line##*=}
    FPS="${FPS%\"}"
    FPS="${FPS#\"}"
  fi
done <<< "$(ffprobe -v quiet -print_format flat -show_format -show_streams -i "$input")"
if [ "$FPS" == "unknown" ] || [ "$FPS" == "parse" ]; then 
  echo ParseFPS Unknown frame rate
fi
echo Found $FPS

Объявить переменную за пределами цикла, установить значение и использовать его вне цикла, необходимо сделать < < < Синтаксис "$ (...)". Приложение необходимо запускать в контексте текущей консоли. Котировки вокруг команды сохраняют новые строки выходного потока.

Соответствие Loop для подстрок затем считывает пару name = value, разделяет правую часть last = character, отбрасывает первую цитату, катит последнюю цитату, мы имеем чистое значение, которое будет использоваться в другом месте.

Whome 30 июнь 2015, в 09:59

2

Хотя ответ верен, я понимаю, как все закончилось здесь. Основной метод такой же, как предложили многие другие ответы. Плюс, он полностью тонет в вашем примере FPS.
Egor Hans 12 нояб. 2017, в 14:14

1

@Peter: это может сработать для вас -

echo "Start!";for p in $(cat ./pep); do
echo $p
done

Это вернет результат -

Start!
RKEKNVQ
IPKKLLQK
QYFHQLEKMNVK
IPKKLLQK
GDLSTALEVAIDCYEK
QYFHQLEKMNVKIPENIYR
RKEKNVQ
VLAKHGKLQDAIN
ILGFMK
LEDVALQILL

Alan Jebakumar 30 авг. 2015, в 06:22

7

Это очень плохо! Почему вы не читаете строки с «для» .
fedorqui 16 июнь 2016, в 10:43
2

Этот ответ побеждает все принципы, изложенные в хороших ответах выше!
codeforester 14 янв. 2017, в 02:55
2

Пожалуйста, удалите этот ответ.
dawg 02 май 2017, в 17:18
2

Ребята, не преувеличивайте. Ответ плохой, но, кажется, работает, по крайней мере, для простых случаев использования. Пока это предусмотрено, плохой ответ не лишает права ответа на существование.
Egor Hans 12 нояб. 2017, в 14:08
1

@EgorHans, я категорически не согласен: смысл ответов в том, чтобы научить людей писать программы. Научить людей делать что-то, что, как вы знаете , вредно для них, а люди, которые используют их программное обеспечение (вводить ошибки / неожиданное поведение и т. Д.), Сознательно вредят другим. Ответ, о котором известно, что он вреден, не имеет «права на существование» в хорошо подготовленном учебном ресурсе (и вылечить его - именно то, что мы, те люди, которые голосуют и отмечают, должны здесь делать).
Charles Duffy 20 сен. 2018, в 16:36
0

@EgorHans, ... между прочим, худший случай потери данных, свидетелем которого я был лично, был вызван тем, что сотрудники ops делали что-то, что "казалось, работало" в скрипте (используя расширение без кавычек для имени файла, который нужно удалить - когда это имя должно содержать только шестнадцатеричные цифры). За исключением ошибки в другом программном обеспечении, было написано имя со случайным содержимым, которое было окружено пробелами * , и было потеряно огромное количество резервных копий данных биллинга.
Charles Duffy 20 сен. 2018, в 16:40

Показать ещё 4 комментария

Ещё вопросы

О, я вижу, что здесь произошло много вещей: все комментарии были удалены, и вопрос был вновь открыт. Просто для справки, принятый ответ в строке «Чтение файла», присваивающий значение переменной, решает проблему каноническим способом и должен быть предпочтительнее, чем принятый здесь.
В общем, если вы используете «cat» только с одним аргументом, вы делаете что-то не так (или неоптимально).
Я попробовал это, и это работает (так же как и Бруно де Фрейн).
Да, это просто не так эффективно, как у Бруно, потому что запускает другую программу без необходимости. Если эффективность имеет значение, делай это Бруно. Я помню свой путь, потому что вы можете использовать его с другими командами, где синтаксис «перенаправление из» не работает.
Есть еще одна, более серьезная проблема: поскольку цикл while является частью конвейера, он выполняется в подоболочке, и поэтому любые переменные, установленные внутри цикла, теряются при его выходе (см. Bash-hackers.org/wiki/doku. php / mirroring / bashfaq / 024 ). Это может быть очень раздражающим (в зависимости от того, что вы пытаетесь сделать в цикле).
@JesperE не могли бы вы разработать альтернативный пример?
@ Огре: Он имеет в виду, что вы должны делать это так, как Бруно сделал в своем принятом ответе. Оба работают. Путь Бруно немного эффективнее, так как он не запускает внешнюю команду для чтения файла. Если эффективность имеет значение, сделайте это Бруно. Если нет, то делайте это так, как вам будет удобно.
@ OgrePsalm33: Уоррен прав. Команда "cat" используется для объединения файлов. Если вы не объединяете файлы, скорее всего, вам не нужно использовать «cat».
Хорошо, имеет смысл. Я хотел подчеркнуть это, потому что я вижу много чрезмерно используемых примеров в сценариях и тому подобном, где «cat» просто служит дополнительным шагом для получения содержимого одного файла.
Я использую "cat file |" как начало многих моих команд исключительно потому, что я часто создаю прототип с помощью "head file |"
@matkelcey Кроме того, как еще вы поместите весь файл в начало конвейера? Bash дает вам здесь строки, которые великолепны (особенно для таких вещей, как, например if grep -q 'findme' <<< "$var" ), но не переносимы, и я бы не хотел запускать большой конвейер с одним из них. Что-то вроде cat ifconfig.output | grep inet[^6] | grep -v '127.0.0.1' | awk '{print $2}' | cut -d':' -f2 легче читать, так как все следует слева направо. Это похоже на нажатие awk вместо cut потому что вам не нужны пустые токены - это своего рода злоупотребление командой, но это именно так и делается.
Это может быть не так эффективно, но гораздо более читабельно, чем другие ответы.
+1 для читабельности, а также модульность - этот код можно легко поместить в более сложный конвейер, заменив 'cat ...' на вывод чего-то еще.
Это намного лучше, чем Бруно написал. Это особенно полезно, когда данные создаются динамически командой. Используя решение Бруно, цикл получит любые данные после того, как команда будет полностью выполнена. Ваше решение дает результат команды на линии в цикл, не беря буфер из системы. например, замените 'cat peptides.txt' на 'find /', или в предыдущем решении 'done <peptides.txt' на 'done <$ (find /)'. он может не справиться с выполнением, поскольку существует вероятность переполнения буфера или использования всей памяти.
К тому времени, когда вы заботитесь о разнице в производительности, вы не будете задавать ТАК такие вопросы.
Это, однако, отлично подходит для grep, sed или любых других манипуляций с текстом, предшествующих чтению.
это не работает, если любая из команд внутри вашего цикла запускает команды через ssh; поток stdin используется (даже если ssh не использует его), и цикл завершается после первой итерации.
@MikeD, это zsh-ism; это не работает в Bash.
Как и в принятом ответе, это будет иметь неприятные сюрпризы без read -r в некоторых угловых случаях. В основном всегда используйте read -r если вам не требуется специфическое поведение обычного read .
Для варианта 1b: нужно ли снова закрывать дескриптор файла? Например, петля может быть внутренней петлей.
Дескриптор файла будет очищен при выходе из процесса. Явное закрытие может быть сделано для повторного использования числа fd. Чтобы закрыть fd, используйте другой exec с синтаксисом &, например: exec 4 <& -
Спасибо за Вариант 2. Я столкнулся с огромными проблемами с Вариантом 1, потому что мне нужно было читать из stdin в цикле; в таком случае вариант 1 не будет работать.
Вы должны более четко указать, что вариант 2 настоятельно не рекомендуется . @masgo Вариант 1b должен работать в этом случае, и его можно комбинировать с синтаксисом перенаправления ввода из Варианта 1a, заменяя done < $filename на done 4<$filename (что полезно, если вы хотите прочитать имя файла из параметра команды , в этом случае вы можете просто заменить $filename на $1 ).
Мне нужно перебрать содержимое файла, например tail -n +2 myfile.txt | grep 'somepattern' | cut -f3 , при запуске команд ssh внутри цикла (использует stdin); Вариант 2 здесь, кажется, единственный путь?
Это не соответствует требованию (итерация по каждой строке), если файл содержит пробелы или символы табуляции, но может быть полезно, если вы хотите выполнить итерацию по каждому полю в файле, разделенном табуляцией / пробелом.
Bash $ (<peptides.txt), возможно, более элегантен, но все же неправильно, как правильно сказал Жоао, вы выполняете логику подстановки команд, где пробел или символ новой строки - это то же самое. Если в строке есть пробел, цикл выполняется ДВАЖДЫ или более для этой одной строки. Поэтому ваш код должен правильно читать: для слова в $ (<peptides.txt); делай .... Если ты точно знаешь, что пробелов нет, то строка равна слову, и ты в порядке.
@ JoaoCosta, maxpolk: Хорошие моменты, которые я не учел. Я отредактировал оригинальный пост, чтобы отразить их. Спасибо!
Использование for делает входные токены / строки подчиненными расширениям оболочки, что обычно нежелательно; попробуйте это: for l in $(echo '* b c'); do echo "[$l]"; done - как вы увидите, * - хотя изначально он был заключен в кавычки - расширяется до файлов в текущем каталоге.
Не забудьте процитировать ваши "$word" и "$line" ...
Joao и maxpolk, вы решаете проблему, которая у меня есть, но я по-прежнему получаю отдельную итерацию для каждой половины каждой строки с пробелом:> cat linkedin_OSInt.txt linkedin.com/vsearch/f?type=all&keywords= "foo bar" linkedin.com/vsearch/f?type=all&keywords="baz bux "> для URL в $ (<linkedin_OSInt.txt); do echo "$ url"; done linkedin.com/vsearch/f?type=all&keywords="foo bar " linkedin.com/vsearch/f?type=all&keywords="baz bux" Я попробую другие подходы здесь, но хотел бы понять, почему этот не делает не работает
@dblanchard: последний пример, использующий $ IFS, должен игнорировать пробелы. Вы пробовали эту версию?
пожалуйста, обратите внимание на изменение cat peptides.txt с помощью find /. цикл for не запустится до того, как завершится внутренняя кошка. между этими шагами возможно переполнение буфера.
То, как эта команда становится намного сложнее, когда решаются важные проблемы, очень хорошо показывает, почему использование for для итерации строк файла - плохая идея. Плюс аспект расширения, упомянутый @ mklement0 (даже если это возможно обойти, введя экранированные кавычки, что снова делает вещи более сложными и менее читаемыми).
Это читаемый единственный ответ, который также читает последнюю строку файла, которая является про.
@ DavidC.Rankin Опция -r предотвращает обратную косую черту. Note #2 является ссылкой, где это описано подробно ...
Объедините это с опцией «читать -u» в другом ответе, и тогда все будет идеально.
@FlorinAndrei: В приведенном выше примере не нужна опция -u , вы говорите о другом примере с -u ?
Просматривал ваши ссылки и был удивлен, что нет ответа, который просто ссылается на вашу ссылку в Примечании 2. Эта страница содержит все, что вам нужно знать об этом предмете. Или ответы только для ссылок не рекомендуется?
@EgorHans: ответы, содержащие только ссылки, как правило, удаляются.
Ах. Хорошо, никогда не предлагать ответ только для ссылки. Может быть, даже были, мы никогда не узнаем.
обратите внимание, что вместо command < input_filename.txt вы всегда можете выполнить input_generating_command | command или command < <(input_generating_command)
Мой я спрашиваю, почему понизить?
Этот ответ нуждается в предостережениях, упомянутых в ответе mightypile , и он может потерпеть неудачу, если любая строка содержит метасимволы оболочки (из-за без кавычек "$ x").
Я на самом деле удивлен, что люди еще не придумали обычные Не читать строки для ...
Хотя ответ верен, я понимаю, как все закончилось здесь. Основной метод такой же, как предложили многие другие ответы. Плюс, он полностью тонет в вашем примере FPS.
Это очень плохо! Почему вы не читаете строки с «для» .
Этот ответ побеждает все принципы, изложенные в хороших ответах выше!
Ребята, не преувеличивайте. Ответ плохой, но, кажется, работает, по крайней мере, для простых случаев использования. Пока это предусмотрено, плохой ответ не лишает права ответа на существование.
@EgorHans, я категорически не согласен: смысл ответов в том, чтобы научить людей писать программы. Научить людей делать что-то, что, как вы знаете , вредно для них, а люди, которые используют их программное обеспечение (вводить ошибки / неожиданное поведение и т. Д.), Сознательно вредят другим. Ответ, о котором известно, что он вреден, не имеет «права на существование» в хорошо подготовленном учебном ресурсе (и вылечить его - именно то, что мы, те люди, которые голосуют и отмечают, должны здесь делать).
@EgorHans, ... между прочим, худший случай потери данных, свидетелем которого я был лично, был вызван тем, что сотрудники ops делали что-то, что "казалось, работало" в скрипте (используя расширение без кавычек для имени файла, который нужно удалить - когда это имя должно содержать только шестнадцатеричные цифры). За исключением ошибки в другом программном обеспечении, было написано имя со случайным содержимым, которое было окружено пробелами * , и было потеряно огромное количество резервных копий данных биллинга.

Bruno De Fraine · Accepted Answer · 2009-10-05T19-04-00.000Z

1579

Лучший ответ

Один из способов сделать это:

while read p; do
  echo "$p"
done <peptides.txt

Как указано в комментариях, это имеет побочные эффекты: обрезание начальных пробелов, интерпретация последовательностей обратной косой черты и пропуск задней строки, если в ней отсутствует завершающий перевод строки. Если это проблемы, вы можете сделать:

while IFS="" read -r p || [ -n "$p" ]
do
  printf '%s\n' "$p"
done < peptides.txt

В исключительных случаях, если тело цикла может читать из стандартного ввода, вы можете открыть файл, используя другой файловый дескриптор:

while read -u 10 p; do
  ...
done 10<peptides.txt

Здесь 10 - просто произвольное число (отличное от 0, 1, 2).

Bruno De Fraine 05 окт. 2009, в 19:04

7

Как мне интерпретировать последнюю строку? Файл peptides.txt перенаправляется на стандартный ввод и как-то на весь блок while?
Peter Mortensen 05 окт. 2009, в 18:16
10

Msgstr "Вставьте peptides.txt в этот цикл while, чтобы команде read было что потреблять". Мой метод "кошка" похож, посылая вывод команды в блок while для потребления "read", только он запускает другую программу для выполнения работы.
Warren Young 05 окт. 2009, в 18:30
0

Это не сработало для меня. Ответ второго ранга, который использовал кошку и трубу, работал для меня.
Karl Katzke 30 июль 2013, в 16:27
6

Этот метод, кажется, пропускает последнюю строку файла.
xastor 07 нояб. 2013, в 07:48
0

Можно ли сделать это в обратном порядке, начиная с нижней части файла?
Dss 14 янв. 2014, в 16:53
0

@Dss Тогда я бы использовал решение, основанное на cat но заменил бы cat на tac .
Bruno De Fraine 16 янв. 2014, в 09:28
0

@BrunoDeFraine Я пробовал это, но TAC, кажется, делает каждый пробел новой строкой. Мне нужна полная строка, разделенная символом перевода строки. возможно я делаю это неправильно.
Dss 16 янв. 2014, в 14:58
0

@BrunoDeFraine Хорошо, я нашел это: unix.stackexchange.com/a/7012 .. Поменяйте cat на tac, и это работает. Спасибо!
Dss 16 янв. 2014, в 16:38
0

@Dss Я имел в виду решение от Уоррена Янга stackoverflow.com/a/1521470/6918 ; просто замените cat на tac, и вы должны прочитать строки в обратном порядке.
Bruno De Fraine 16 янв. 2014, в 19:25
3

Двойные кавычки строк! эхо "$ p" и файл .. поверьте мне, это укусит вас, если вы этого не сделаете !!! Я ЗНАЮ! лол
Mike Q 19 авг. 2014, в 17:01
0

Этот вариант -u сделал мой день;) Спасибо!
Jose Antonio Alvarez Ruiz 31 авг. 2016, в 10:35
1

Обе версии не могут прочитать последнюю строку, если она не заканчивается новой строкой. Всегда используйте while read p || [[ -n $p ]]; do ...
dawg 07 сен. 2016, в 14:15
0

Это не работает для строк, заканчивающихся обратной косой чертой "\". Строки, заканчивающиеся обратным слешем, будут добавлены к следующей строке (и \ будет удален).
Veda 17 янв. 2017, в 11:11
0

@ Веда Теперь это странно. Я ожидаю, что вы получите дополнительный n после обратной косой черты, и строки будут объединены. Поскольку это означало бы, что обратная косая черта экранирует обратную косую черту \n , в результате чего она интерпретируется буквально, а не как новая строка. Но тот факт, что обратная косая черта исчезает, как и символ новой строки, означает, что он расходуется для какого-то побега, как ожидалось, но объединяется с исходным символом новой строки в то, что не печатается ... У вас есть инструмент, который отображает непечатные символы каким-то образом? Заинтересовал бы меня, к чему это приведет.
Egor Hans 12 нояб. 2017, в 14:37
0

@EgorHans \ \ экранирует символ "\ n", который является одним символом. Google для "таблицы ASCII". Символ 10 - \ n, а символ 13 - \ r. Инструмент Linux "xxd" покажет вам символы. Файл с a\na\n\\n будет выглядеть так: 610a 610a 5c0a ( 610a 610a 5c0a - это шестнадцатеричное для 10, поэтому \ n). Таким образом, в последнем случае символ «5c» или «\» экранирует один символ.
Veda 13 нояб. 2017, в 15:32
0

@ Веда Ах, хорошо, теперь я понимаю лучше. Не осознавал, что содержимое файла сбрасывается в поток выполнения так, как оно находится внутри файла, где, конечно, \n - это один символ. По какой-то причине я думал, что это возвращается к последовательности управления во время обработки. Тем не менее, несколько странно, что экранированный символ \n - это что-то без печатного представления. Можно было бы ожидать, что он будет преобразован в последовательность символов "\ n" после экранирования.
Egor Hans 14 нояб. 2017, в 16:30
0

Будь благословенна твоя душа за эту другую команду дескриптора файла, я была счастлива, потратила 8 дней на ошибку, вызванную стандартной заменой ввода. +1
Shmiggy 03 окт. 2018, в 12:21
0

В первом примере не хватает ";" после того как сделано
Miguel Ortiz 19 март 2019, в 13:26

Показать ещё 16 комментариев

Перебирая содержимое файла в Bash

11 ответов

Чтение из файла с разделителями

Чтение из вывода другой команды, используя подстановку процесса

Чтение с ввода с нулевым разделением, например, find... -print0

Чтение из более чем одного файла одновременно

Чтение всего файла в массив (версии Bash ранее до 4)

Чтение всего файла в массив (версии Bash 4x и выше)

Ещё вопросы

Чтение с ввода с нулевым разделением, например, `find... -print0`