Как «grep» непрерывный поток?

Question

Как «grep» непрерывный поток?

638

Можно ли использовать grep для непрерывного потока?

Я имею в виду некоторую команду tail -f <file>, но с grep на выходе, чтобы сохранить только интересующие меня строки.

Я пробовал tail -f <file> | grep pattern, но кажется, что grep может выполняться только один раз tail заканчивается, то есть никогда.

Matthieu Napoli 23 авг. 2011, в 14:33

Источник

9

Весьма вероятно, что программа, генерирующая файл, не сбрасывает вывод.
Steve-o 23 авг. 2011, в 13:38
0

работает tail -f file (я вижу новый вывод в реальном времени)
Matthieu Napoli 23 авг. 2011, в 13:44
5

Было бы целесообразно unix.stackexchange.com
Luc M 23 авг. 2011, в 13:44
0

@Luc действительно, не думал об этом
Matthieu Napoli 23 авг. 2011, в 13:45
0

Может быть, нет новых строк в вашем входном потоке? Если так, то grep не будет продолжаться.
Lynch 23 авг. 2011, в 14:43
0

Это часто задаваемые вопросы: mywiki.wooledge.org/BashFAQ/009
tripleee 14 окт. 2014, в 14:49
0

хе-хе, буферизация в конвейерах! может быть, эти ответы помогут кому-нибудь погуглить эту тему здесь
xealits 17 июль 2016, в 20:16
0

@Lynch Я столкнулся с проблемой, о которой вы упомянули, когда grep из очень медленного (бесконечного сна) пропаренного журнала, и строка, которую я произвел, находится прямо перед командой sleep, поэтому новая строка не передается и никогда не завершается. Можете ли вы дать намек?
Psyduck 24 янв. 2019, в 23:01
0

@Psyduck Если я правильно понимаю, проблема в том, что буфер никогда не очищается в вашем случае. Я не проверял это, но может быть unbuffer может помочь: linux.die.net/man/1/unbuffer
Lynch 28 фев. 2019, в 19:22

Показать ещё 7 комментариев

Теги:

bash

grep

linux

shell

tail

11 ответов

108

Я использую tail -f <file> | grep <pattern> все время.

Он будет ждать, пока grep не начнет сбрасываться, пока он не закончится (я использую Ubuntu).

Irit Katriel 23 авг. 2011, в 15:25

3

Что может длиться довольно долго, поэтому постарайтесь не терять терпение.
glglgl 23 авг. 2011, в 13:41
0

Сколько времени это может занять примерно?
Matthieu Napoli 23 авг. 2011, в 13:47
0

@Matthieu: Зависит в основном от того, что вы ищете, и насколько велики буферы в вашей ОС. Если grep соответствует только короткой строке каждые несколько часов, это будет за несколько дней до первого сброса.
tripleee 23 авг. 2011, в 13:53
13

Tail не использует буферизацию вывода - grep использует.
XzKto 23 авг. 2011, в 14:02
6

Нет, grep не выполняет буферизацию вывода, когда вывод идет на tty-устройство, как это ясно в этом ответе. Это делает буферизацию строки! Это правильный ответ и должен быть принятым ответом. Смотрите мой более длинный комментарий к принятому в настоящее время ( неправильному ) ответу для более подробной информации.
Michael Goldshteyn 09 дек. 2015, в 17:23
0

Это решение, которое работало у меня в Git Bash на Windows. (Ниже удален мой аналогичный ответ, который включал необязательный - для grep, ненужный.)
aneroid 27 окт. 2016, в 04:06
0

@MichaelGoldshteyn, как указывалось несколько раз в ответ на ваш более длинный ответ, ваша информация относится только к GNU grep, а не к BSD или другим реализациям, так что вы можете проверить свою агрессию и уверенность в себе, хей?
Wes Mason 18 апр. 2018, в 11:14

Показать ещё 5 комментариев

53

Я думаю, что ваша проблема в том, что grep использует некоторую буферизацию вывода. Попробуйте

tail -f file | stdbuf -o0 grep my_pattern

он установит режим буферизации вывода grep небуферизованным.

XzKto 23 авг. 2011, в 14:35

7

И это имеет то преимущество, что может использоваться для многих других команд, кроме grep .
Peter V. Mørch 05 июль 2012, в 11:08
4

Однако, как я обнаружил после более подробного изучения, некоторые команды сбрасывают свой вывод только при подключении к tty, и для этого unbuffer (в пакете expect-dev на debian) является королем . Так что я бы использовал unbuffer поверх stdbuf.
Peter V. Mørch 07 июль 2012, в 19:41
4

@Peter V. Mørch Да, вы правы, иногда небуферы могут работать там, где stdbuf не может. Но я думаю, что вы пытаетесь найти «волшебную» программу, которая всегда решит ваши проблемы, вместо того, чтобы понять вашу проблему. Создание виртуального tty это не связанная задача. Stdbuf делает именно то, что нам нужно (устанавливает стандартный выходной буфер, чтобы дать значение), тогда как unbuffer делает много скрытых вещей, которые нам могут не понадобиться (сравните интерактивную top с stdbuf и unbuffer). И на самом деле не существует «волшебного» решения: иногда небуферы тоже терпят неудачу, например, awk использует другую реализацию буфера (stdbuf тоже не будет работать).
XzKto 09 июль 2012, в 07:48
2

«Но я думаю, что вы пытаетесь найти« волшебную »программу, которая всегда решит ваши проблемы вместо того, чтобы понять вашу проблему». - Я думаю ты прав! ;-)
Peter V. Mørch 10 июль 2012, в 08:27
1

Дополнительная информация о stdbuf , ` stdbuf stdio на сайте pixelbeat.org/programming/stdio_buffering
Tor Klingberg 27 апр. 2015, в 14:45

Показать ещё 3 комментария

8

В большинстве случаев вы можете tail -f /var/log/some.log |grep foo, и он будет работать нормально.

Если вам нужно использовать несколько grep в работающем файле журнала, и вы обнаружите, что у вас нет выхода, вам может понадобиться вставить переключатель --line-buffered в grep (s) средний, например так:

tail -f /var/log/some.log | grep --line-buffered foo | grep bar

Dale Anderson 04 май 2016, в 18:32

6

Если вы хотите найти совпадения во всем файле (а не только в хвосте), и вы хотите, чтобы он сидел и ждал новых совпадений, это прекрасно работает:

tail -c +0 -f <file> | grep --line-buffered <pattern>

Флаг -c +0 указывает, что выход должен начинаться с 0 bytes (-c) с начала (+) файла.

Ken Williams 11 сен. 2017, в 22:56

3

Не видел, чтобы кто-нибудь предложил мое обычное решение для этого:

less +F <file>
ctrl + c
/<search term>
<enter>
shift + f

Я предпочитаю это, потому что вы можете использовать ctrl + c для остановки и навигации по файлу в любое время, а затем просто нажать shift + f чтобы вернуться к поиску в реальном времени.

Hans.Loven.work 10 апр. 2018, в 03:42

1

sed будет лучшим выбором (редактор потоков)

tail -n0 -f <file> | sed -n '/search string/p'

и затем, если вы хотите, чтобы команда tail выходила, как только вы нашли конкретную строку:

tail --pid=$(($BASHPID+1)) -n0 -f <file> | sed -n '/search string/{p; q}'

Очевидно, что bashism: $ BASHPID будет идентификатором процесса команды tail. Команда sed будет следующей после tail в конвейере, поэтому идентификатор процесса sed будет $ BASHPID + 1.

Christian Herr 21 апр. 2017, в 17:58

1

Предположение о том, что следующий процесс, запущенный в системе ( $BASHPID+1 ), будет вашим, во многих ситуациях ложно, и это ничего не делает для решения проблемы буферизации, о которой, вероятно, пытался спросить OP. В частности, рекомендация sed grep здесь кажется просто вопросом (сомнительного) предпочтения. (Вы можете получить поведение p;q с помощью grep -m 1 если вы пытаетесь достичь этого.)
tripleee 16 авг. 2017, в 09:17
0

Работает, команда sed печатает каждую строку, как только она готова, команда grep с параметром --line-buffered нет. Я искренне не понимаю минус 1.
MUY Belgium 23 авг. 2018, в 10:33
0

До сих пор было установлено, что буферизация - это проблема с grep . Никаких специальных действий для обработки буферизации строк с использованием sed не требуется, это поведение по умолчанию, поэтому я подчеркиваю поток слов. И правда, нет никакой гарантии, что $ BASHPID + 1 будет правильным pid для последующего выполнения, но поскольку распределение pid является последовательным, а команда piped назначается pid сразу после него, это вполне вероятно.
Christian Herr 11 янв. 2019, в 19:29

Показать ещё 1 комментарий

1

вы можете рассмотреть этот ответ как улучшение. Обычно я использую

tail -F <fileName> | grep --line-buffered  <pattern> -A 3 -B 5

-F лучше в случае поворота файла (-f не будет работать должным образом, если файл повернут)

-A и -B полезно для получения строк непосредственно перед и после появления шаблона.. эти блоки появятся между разделителями пунктирных линий

mebada 28 июль 2016, в 00:02

2

grep -C 3 <pattern> , заменяет -A <N> и -B <N>, если N одинаково.
Arun Sangal 02 март 2017, в 00:45

0

Эта команда работает для меня (Suse):

mail-srv:/var/log # tail -f /var/log/mail.info |grep --line-buffered LOGIN  >> logins_to_mail

сбор логинов к почтовому сервису

user10584393 31 окт. 2018, в 08:46

0

Да, на самом деле все будет хорошо. Grep, и большинство команд Unix работают по потокам по одной строке за раз. Каждая строка, которая выходит из хвоста, будет анализироваться и передаваться, если она соответствует.

Caleb 23 авг. 2011, в 14:07

2

Это не совсем правильно. Если grep является последней командой в цепочке каналов, она будет действовать так, как вы объясните. Однако, если он находится посередине, он будет буферизовать около 8 тыс. Выводов одновременно.
Mahmoud Al-Qudsi 18 фев. 2016, в 00:52

-2

Используйте awk (еще одна полезная утилита bash) вместо grep, где у вас нет опции для буферизации строк! Он будет непрерывно передавать ваши данные из хвоста.

вот как вы используете grep

tail -f <file> | grep pattern

Вот как вы будете использовать awk

tail -f <file> | awk '/pattern/{print $0}'

Atif 22 июнь 2014, в 13:54

6

Это не правильно; Awk из коробки выполняет буферизацию строки, как и большинство других стандартных инструментов Unix. (Более того, {print $0} является избыточным, поскольку печать является действием по умолчанию при выполнении условия.)
tripleee 09 фев. 2015, в 14:00

Ещё вопросы

Весьма вероятно, что программа, генерирующая файл, не сбрасывает вывод.
работает tail -f file (я вижу новый вывод в реальном времени)
Было бы целесообразно unix.stackexchange.com
@Luc действительно, не думал об этом
Может быть, нет новых строк в вашем входном потоке? Если так, то grep не будет продолжаться.
Это часто задаваемые вопросы: mywiki.wooledge.org/BashFAQ/009
хе-хе, буферизация в конвейерах! может быть, эти ответы помогут кому-нибудь погуглить эту тему здесь
@Lynch Я столкнулся с проблемой, о которой вы упомянули, когда grep из очень медленного (бесконечного сна) пропаренного журнала, и строка, которую я произвел, находится прямо перед командой sleep, поэтому новая строка не передается и никогда не завершается. Можете ли вы дать намек?
@Psyduck Если я правильно понимаю, проблема в том, что буфер никогда не очищается в вашем случае. Я не проверял это, но может быть unbuffer может помочь: linux.die.net/man/1/unbuffer
Что может длиться довольно долго, поэтому постарайтесь не терять терпение.
Сколько времени это может занять примерно?
@Matthieu: Зависит в основном от того, что вы ищете, и насколько велики буферы в вашей ОС. Если grep соответствует только короткой строке каждые несколько часов, это будет за несколько дней до первого сброса.
Tail не использует буферизацию вывода - grep использует.
Нет, grep не выполняет буферизацию вывода, когда вывод идет на tty-устройство, как это ясно в этом ответе. Это делает буферизацию строки! Это правильный ответ и должен быть принятым ответом. Смотрите мой более длинный комментарий к принятому в настоящее время ( неправильному ) ответу для более подробной информации.
Это решение, которое работало у меня в Git Bash на Windows. (Ниже удален мой аналогичный ответ, который включал необязательный - для grep, ненужный.)
@MichaelGoldshteyn, как указывалось несколько раз в ответ на ваш более длинный ответ, ваша информация относится только к GNU grep, а не к BSD или другим реализациям, так что вы можете проверить свою агрессию и уверенность в себе, хей?
И это имеет то преимущество, что может использоваться для многих других команд, кроме grep .
Однако, как я обнаружил после более подробного изучения, некоторые команды сбрасывают свой вывод только при подключении к tty, и для этого unbuffer (в пакете expect-dev на debian) является королем . Так что я бы использовал unbuffer поверх stdbuf.
@Peter V. Mørch Да, вы правы, иногда небуферы могут работать там, где stdbuf не может. Но я думаю, что вы пытаетесь найти «волшебную» программу, которая всегда решит ваши проблемы, вместо того, чтобы понять вашу проблему. Создание виртуального tty это не связанная задача. Stdbuf делает именно то, что нам нужно (устанавливает стандартный выходной буфер, чтобы дать значение), тогда как unbuffer делает много скрытых вещей, которые нам могут не понадобиться (сравните интерактивную top с stdbuf и unbuffer). И на самом деле не существует «волшебного» решения: иногда небуферы тоже терпят неудачу, например, awk использует другую реализацию буфера (stdbuf тоже не будет работать).
«Но я думаю, что вы пытаетесь найти« волшебную »программу, которая всегда решит ваши проблемы вместо того, чтобы понять вашу проблему». - Я думаю ты прав! ;-)
Дополнительная информация о stdbuf , ` stdbuf stdio на сайте pixelbeat.org/programming/stdio_buffering
Предположение о том, что следующий процесс, запущенный в системе ( $BASHPID+1 ), будет вашим, во многих ситуациях ложно, и это ничего не делает для решения проблемы буферизации, о которой, вероятно, пытался спросить OP. В частности, рекомендация sed grep здесь кажется просто вопросом (сомнительного) предпочтения. (Вы можете получить поведение p;q с помощью grep -m 1 если вы пытаетесь достичь этого.)
Работает, команда sed печатает каждую строку, как только она готова, команда grep с параметром --line-buffered нет. Я искренне не понимаю минус 1.
До сих пор было установлено, что буферизация - это проблема с grep . Никаких специальных действий для обработки буферизации строк с использованием sed не требуется, это поведение по умолчанию, поэтому я подчеркиваю поток слов. И правда, нет никакой гарантии, что $ BASHPID + 1 будет правильным pid для последующего выполнения, но поскольку распределение pid является последовательным, а команда piped назначается pid сразу после него, это вполне вероятно.
grep -C 3 <pattern> , заменяет -A <N> и -B <N>, если N одинаково.
Это не совсем правильно. Если grep является последней командой в цепочке каналов, она будет действовать так, как вы объясните. Однако, если он находится посередине, он будет буферизовать около 8 тыс. Выводов одновременно.
Это не правильно; Awk из коробки выполняет буферизацию строки, как и большинство других стандартных инструментов Unix. (Более того, {print $0} является избыточным, поскольку печать является действием по умолчанию при выполнении условия.)

tad · Accepted Answer · 2011-08-23T15-20-00.000Z

1184

Лучший ответ

Включите режим буферизации строки grep при использовании BSD grep (FreeBSD, Mac OS X и т.д.)

tail -f file | grep --line-buffered my_pattern

Вам не нужно делать это для GNU grep (используется практически во всех Linux), поскольку он будет сбрасываться по умолчанию (YMMV для других Unix-подобных приложений, таких как SmartOS, AIX или QNX).

tad 23 авг. 2011, в 15:20

2

что произойдет, если я подключу файл журнала, который будет вращаться, пока он работает? Будет ли logrotate иметь возможность вращать файл?
Michael Niemand 05 май 2015, в 07:59
3

@MichaelNiemand и вы можете использовать tail -F file | grep - line-buffered my_pattern
jcfrei 26 май 2015, в 16:28
0

и убедитесь, что вы удалили свои обычные флаги, которые вам не нравятся, как -r (для других дураков)
Colin 19 июнь 2015, в 15:58
46

@MichaelGoldshteyn Полегче. Люди одобряют это, потому что они находят эту страницу, когда они Google "буферизируют строку grep", и это решает проблему для них, которая может быть не совсем той, которая была поставлена перед вопросом.
raine 15 фев. 2016, в 19:31
3

@MichaelGoldshteyn, похоже, правда в определенных ситуациях. Например, я выполняю команду удаленно в автоматическом сеансе ssh (указав команду в аргументах). У вас есть более полное объяснение? Спасибо!
caesarsol 22 март 2016, в 13:51
0

@MichaelGoldshteyn - Я подозреваю, что проблема заключается в том, что люди подтверждают, что она дает правильный вывод, выполняя команду сами, а затем повышают ее, не понимая, что часть "--line-buffered" совершенно лишняя.
M. Justin 06 сен. 2016, в 14:58
4

Я пришел сюда, пытаясь получить вывод strace . Без --line-buffered это не сработает.
sjas 11 сен. 2016, в 22:22
5

@MichaelGoldshteyn (и авторы его комментариев): у меня всегда была эта проблема с tail -f | grep и --line-buffered решают эту проблему за меня (в Ubuntu 14.04, GNU grep версии 2.16). Где реализована логика использования строки, если stdout является tty? В git.savannah.gnu.org/cgit/grep.git/tree/src/grep.c line_buffered устанавливается только анализатором аргументов.
Aasmund Eldhuset 09 янв. 2017, в 22:21
0

Я не думаю, что --line-bufferred является опцией по умолчанию, по крайней мере, не для соединений ssh. У меня всегда была эта проблема, и я никогда не узнавал о новой - с буферизацией строки до сегодняшнего дня ... прекрасно работает!
rmeden 05 март 2017, в 18:26
7

@MichaelGoldshteyn Я на macOS с использованием BSD grep и без --line-buffered я не получаю вывод. Однако после тестирования похоже, что GNU grep делает то, что вы описываете. Так что, как и большинство вещей в Unix, это зависит от реализации вашей платформы. Поскольку в вопросе не указана платформа, ваша информация представляется ложной - после просмотра кода для BSD grep и сравнения его с GNU grep, поведение определенно контролируется опцией --line-buffered. Просто GNU grep сбрасывает по умолчанию.
Richard Waite 28 окт. 2017, в 22:37

Показать ещё 8 комментариев