grep вкладка в UNIX

Question

grep вкладка в UNIX

326

Как вкладка grep (\ t) в файлах на платформе Unix?

Sachin Chourasiya 01 дек. 2009, в 10:25

Источник

46

просто используйте grep "<Ctrl+V><TAB>" , это работает (если в первый раз: введите grep " затем нажмите комбинацию клавиш Ctrl + V, затем нажмите клавишу TAB, затем введите " и нажмите ввод, вуаля!)
rook 05 авг. 2013, в 15:19
12

Ctrl + V - ДЕЙСТВИТЕЛЬНО ПЛОХАЯ ИДЕЯ! ... да, он может работать из консоли, но он может не работать, чтобы набрать его в сценарии (вы находитесь в зависимости от редактора, например, я использую mcedit и ctrl + v не работают там)
THESorcerer 21 фев. 2014, в 00:36
0

Связанные, но не дубликаты: Поиск вкладок, без -P, используя 'grep'
Peter Mortensen 13 март 2015, в 10:18
0

Смотрите также: askubuntu.com/questions/53071/… (ссылка также ниже)
shiri 03 июль 2017, в 16:39

Показать ещё 2 комментария

Теги:

grep

unix

21 ответ

Ещё вопросы

просто используйте grep "<Ctrl+V><TAB>" , это работает (если в первый раз: введите grep " затем нажмите комбинацию клавиш Ctrl + V, затем нажмите клавишу TAB, затем введите " и нажмите ввод, вуаля!)
Ctrl + V - ДЕЙСТВИТЕЛЬНО ПЛОХАЯ ИДЕЯ! ... да, он может работать из консоли, но он может не работать, чтобы набрать его в сценарии (вы находитесь в зависимости от редактора, например, я использую mcedit и ctrl + v не работают там)
Связанные, но не дубликаты: Поиск вкладок, без -P, используя 'grep'
Смотрите также: askubuntu.com/questions/53071/… (ссылка также ниже)

unwind · Answer 1 · 2009-12-01T12-58-00.000Z

308

Если вы используете GNU grep, вы можете использовать regexp в стиле Perl:

$ grep -P '\t' *

unwind 01 дек. 2009, в 12:58

0

Кажется, это не работает против моей картины. Попытка использовать этот синтаксис ничего не печатает. (Отличается ли вариант Mac OS X?)
futureelite7 28 фев. 2010, в 15:42
2

@futureelite: Согласно документации Apple ( developer.apple.com/Mac/library/documentation/Darwin/Reference/… ), программа grep для Mac OS X должна поддерживать параметр -P. Попробуйте создать новый вопрос на сайте superuser.com.
unwind 28 фев. 2010, в 16:17
2

Это очень хорошо для GNU UNIX, но как насчет POSIX Solaris, AIX и HP-UX? Те, кто ничего не знает о опции -P .
rook 05 авг. 2013, в 15:17
19

@rook GNU не UNIX.
ikdc 01 май 2014, в 15:42
0

Работает как шарм. Я использую Grep на Windows 7 (из GnuWin32)
BearCode 06 май 2014, в 11:54
0

Решение <Ctrl-V> SamK ( stackoverflow.com/a/4691757/2516301 ) работает быстрее
vefthym 06 июнь 2014, в 13:48
4

в Mac OSX вы можете задать шаблон, используя -e
Faisal Feroz 20 фев. 2015, в 07:16

Показать ещё 5 комментариев

antimirov · Answer 2 · 2011-04-17T17-37-00.000Z

225

Хитрость заключается в использовании знака $перед кавычками single. Он также работает для вырезания и других инструментов.

$ grep $'\t' sample.txt

antimirov 17 апр. 2011, в 17:37

7

Спасательный круг спасает жизни! Насколько я могу судить, он работает и в zsh . Не могли бы вы прокомментировать, что такое семантика этого знака $ ?
Romain 25 янв. 2012, в 15:16
13

gnu.org/software/bash/manual/bashref.html#ANSI_002dC-Quoting
teambob 29 янв. 2012, в 23:48
1

Не работает, если строка содержит что-либо кроме '\ t'. Как бы вы искали "\ t" (табуляция + пробел) например?
Raman 17 апр. 2013, в 15:05
6

Раман: Вы можете использовать $'\t'' ' . Реальный пример, который показывает, что он работает также с sh (не только bash, который по умолчанию не установлен на Android) - это busybox grep -oE '^nodev'$'\t''fuse$' /proc/filesystems .
v6ak 21 июль 2013, в 07:14
0

Работает во FreeBSD, где -P не
cs_alumnus 01 окт. 2014, в 21:57
1

Спасибо за это. Работает на солярисе.
woot 14 сен. 2015, в 04:11
0

@Raman также работал с обычными буквами, например, zgrep $'\tPara\t' * - нашел "Para" в окружении вкладок с помощью Ubuntu 14 bash
yetanothercoder 10 март 2016, в 16:38
0

И если вам нужно объединить это \t с другими символами, используйте $'\t\|[;.,|]' .
James Brown 09 июнь 2016, в 11:08
3

Я думаю, что $ '...' - идиома bash. Вероятно, не работает в ш. Не знаю про csh или tcsh.
Edward Falk 31 авг. 2016, в 18:45
0

Я могу подтвердить, что $ '' не работает с sh. Но это работает в Zsh.
Att Righ 01 фев. 2017, в 15:15
1

Для заинтересованных читателей $ '\ t' превращается в буквальный символ табуляции.
Att Righ 01 фев. 2017, в 15:16
0

'echo -n $' \ t '| xxd -ps' показывает '09' (0x09 - TAB). @teambob и Att Righ, спасибо, что объяснили. Это башизм.
gaoithe 24 фев. 2017, в 15:15
1

От 'man bash': слова вида $ 'string' обрабатываются специально. Слово расширяется до строки, символы с обратной косой чертой заменяются в соответствии со стандартом ANSI C. Escape-последовательности с обратной косой чертой, если они есть, декодируются ...
broeni 22 нояб. 2017, в 14:44
0

В дополнение к xxd , другой способ проверить это: echo -n $'\t' | od -tx1
typelogic 05 окт. 2018, в 23:46

Показать ещё 12 комментариев

SamK · Answer 3 · 2011-01-14T14-01-00.000Z

77

Мне никогда не удавалось использовать метасимвол '\ t' с grep. Однако я нашел два альтернативных решения:

Использование <Ctrl-V> <TAB> (нажатие Ctrl-V, набрав вкладку)
Использование awk: foo | awk '/\t/'

SamK 14 янв. 2011, в 14:01

3

| awk '/\t/' Решение | awk '/\t/' будет работать для всех оболочек, платформ и систем.
Samveen 29 июнь 2012, в 06:45
6

+1 для портативного решения POSIX и не использующего bashisms, zshism, GNUism и linuxisms.
Jens 05 май 2013, в 16:56
1

Ctrl-V бесполезен, если вы хотите скопировать-вставить (из ваших заметок или скрипта). Лучше использовать явное решение, которое имеет видимые '\ t', буквенные TAB (то есть те, которые выглядят как пробелы) часто преобразуются в SPC при копировании ...
plijnzaad 07 март 2017, в 11:39

Показать ещё 1 комментарий

Poo · Answer 4 · 2016-01-18T09-17-00.000Z

Из этого ответа на Ask Ubuntu:

Скажите grep использовать регулярные выражения, определенные Perl (Perl имеет \t как вкладка):
grep -P "\t" <file name>
Используйте символ символа в буквах:
grep "^V<tab>" <filename>
Используйте printf для печати символа табуляции для вас:
grep "$(printf '\t')" <filename>

Ctrl-V бесполезен, если вы хотите скопировать-вставить (из ваших заметок или скрипта). Лучше использовать явное решение, которое имеет видимые '\ t', буквенные TAB (то есть те, которые выглядят как пробелы) часто преобразуются в SPC при копировании
Спасибо за подсказку ctrl-V, я никогда не знал, как написать буквенную вкладку в командной строке.

tjmoore · Answer 5 · 2009-12-01T12-43-00.000Z

29

Один из способов (это с Bash)

grep -P '\t'

-P включает регулярные выражения в Perl, поэтому \t будет работать.

Как говорит пользователь, он может быть специфичен для GNU grep. Альтернативой является буквально вставить вкладку там, если это разрешит оболочка, редактор или терминал.

tjmoore 01 дек. 2009, в 12:43

0

Неизвестная опция P в оболочке ksh
Sachin Chourasiya 01 дек. 2009, в 11:32
0

Как говорит раскрутка, может быть специфична для GNU grep. Только что уточнил.
tjmoore 01 дек. 2009, в 11:33
0

Как добавить вкладку? Не запускается ли процесс автозавершения при нажатии кнопки табуляции? (это может работать в скрипте bash, но не в командной строке)
AntonioCS 08 апр. 2011, в 13:57
1

Это в любой оболочке.
stepancheg 29 июнь 2011, в 21:13
1

@AntonioCS, как отмечено выше SamKrieg, для того, чтобы Shell позволяла вам вводить любой символ, сначала наберите CTRL-v. Смотрите также askubuntu.com/questions/53071/…
Denis Arnaud 01 авг. 2012, в 13:55
1

-P специфичен для grep, а не для любой оболочки. -P должен работать в любой оболочке, если GNU grep установлен
plijnzaad 07 март 2017, в 11:40

Показать ещё 4 комментария

Steven Penny · Answer 6 · 2014-04-15T18-44-00.000Z

Это не совсем то, что вы ищете, но можете работать в вашем случае

grep '[[:blank:]]'

Эквивалентно

grep -P '[ \t]'

Итак, он найдет Space и Tab.

& sect; Классы символов

Заметьте, он не объявлен в моем man grep, но все еще работает

$ man grep | grep blank | wc
      0       0       0

@ A-letubby Теперь работает с правкой - был добавлен аргумент -P .

vanjoe · Answer 7 · 2014-05-09T04-35-00.000Z

Используйте эхо, чтобы вставить вкладку для вас grep "$(echo -e \\t)"

Mike Volokhov · Answer 8 · 2017-10-23T14-50-00.000Z

В основном есть два способа решить эту проблему:

(Рекомендуется) Используйте синтаксис регулярных выражений, поддерживаемый grep (1). Современный grep (1) поддерживает две формы синтаксиса regex POSIX 1003.2: базовые (устаревшие) RE и современные RE. Синтаксис подробно описан в справочных страницах re_format (7) и regex (7), которые являются частью систем BSD и Linux соответственно. GNU grep (1) также поддерживает Perl-совместимые RE, предоставленные библиотекой pcre (3).

В языке регулярных выражений символ табуляции обычно кодируется атомом \t. Атом поддерживается расширенными регулярными выражениями BSD (egrep, grep -E в BSD-совместимой системе), а также Perl-совместимыми REs (pcregrep, GNU grep -P).

Оба базовых регулярных выражения и расширенные версии Linux, по-видимому, не поддерживают \t. Пожалуйста, обратитесь к странице служебных программ UNIX, чтобы узнать, какой язык регекса он поддерживает (отсюда и разница между командами sed (1), awk (1) и pcregrep (1)).

Поэтому в Linux:
```
$ grep -P '\t' FILE ...
```
В BSD подобная система:
```
$ egrep '\t' FILE ...
$ grep -E '\t' FILE ...
```
Передайте символ табуляции в шаблон. Это просто, когда вы редактируете файл script:
```
# no tabs for Python please!
grep -q '   ' *.py && exit 1
```
Однако при работе в интерактивной оболочке вам может потребоваться использовать возможности оболочки и терминала для ввода правильного символа в строку. На большинстве терминалов это можно сделать с помощью комбинации клавиш Ctrl + V, которая инструктирует терминал обрабатывать следующий входной символ буквально (V для "дословно" ):
```
$ grep '<Ctrl>+<V><TAB>' FILE ...
```
Некоторые оболочки могут предлагать расширенную поддержку набора команд. Такие, в bash (1) слова вида $'string' рассматриваются специально:
```
bash$ grep $'\t' FILE ...
```
Обратите внимание, что, хотя в командной строке это хорошо, это может привести к проблемам с совместимостью, когда script будет перемещен на другую платформу. Кроме того, будьте осторожны с кавычками при использовании специальных принадлежностей, пожалуйста, обратитесь к bash (1) для деталей.

Для оболочки Bourne (и не только) такое же поведение можно эмулировать с помощью подстановки команд, дополненной printf (1), чтобы построить правильное регулярное выражение:
```
$ grep "`printf '\t'`" FILE ...
```

kumar303 · Answer 9 · 2017-03-03T06-34-00.000Z

grep "$(printf '\t')" работал у меня в Mac OS X

Julio · Answer 10 · 2013-07-16T17-44-00.000Z

Хорошим выбором является использование sed как grep (как объяснено в этом классическом sed tutorial).

sed -n 's/pattern/&/p' file

Примеры (работает в bash, sh, ksh, csh,..):

[~]$ cat testfile
12 3
1 4 abc
xa      c
        a       c\2
1 23

[~]$ sed -n 's/\t/&/p' testfile 
xa      c
        a       c\2

[~]$ sed -n 's/\ta\t/&/p' testfile
        a       c\2

Zsigmond Lőrinczy · Answer 11 · 2015-07-24T07-49-00.000Z

+1 способ, который работает в ksh, тире и т.д.: используйте printf для вставки TAB:

grep "$(printf 'BEGIN\tEND')" testfile.txt

Это не сработало для меня в Ubuntu Trusty (Bash 4.3.11), хотя сработало следующее: grep "$(printf '\t')" testfile.txt

Raman · Answer 12 · 2017-07-04T08-23-00.000Z

Обозначение $'\ t', заданное в других ответах, является специфичным для оболочки - оно работает в bash и zsh, но не является универсальным.

ПРИМЕЧАНИЕ. Ниже приведена оболочка fish и не работает в bash:

В оболочке fish можно использовать unquoted \t, например:

grep \t foo.txt

Или можно использовать шестнадцатеричные или уникодовые обозначения, например:

grep \X09 foo.txt
grep \U0009 foo.txt

(эти обозначения полезны для более эзотерических символов)

Поскольку эти значения должны быть не кавычками, можно комбинировать кавычки и некотируемые значения путем конкатенации:

grep "foo"\t"bar"

user261380 · Answer 13 · 2016-04-23T21-24-00.000Z

Эти альтернативные бинарные методы идентификации полностью функциональны. И мне очень нравится тот, который использует awk, поскольку я не мог полностью запомнить синтаксическое использование с одиночными двоичными символами. Однако также должно быть возможно назначить переменную оболочки значение в переносном режиме POSIX (т.е. TAB = echo "@" | tr "\100" "\011"), а затем использовать ее повсюду в переносном режиме POSIX; также (например, grep "$ TAB" filename). Хотя это решение хорошо работает с TAB, оно также хорошо работает с другими двоичными символами, когда в присваивании используется другое желаемое двоичное значение (вместо значения для символа TAB для "tr" ).

kshpolvind · Answer 14 · 2016-02-23T03-09-00.000Z

Возможно, вы захотите использовать grep "$(echo -e '\t')"

Только требование echo должно быть способно интерпретировать обратные слэши.

s8129 · Answer 15 · 2015-09-08T12-18-00.000Z

Использование метода "sed-as-grep", но замена вкладок видимым персонажем личных предпочтений - мой любимый метод, так как он ясно показывает, какие файлы содержат запрошенную информацию, а также где она помещается в строки

sed -n 's/\t/\*\*\*\*/g' file_name

Если вы хотите использовать информацию о линии/файле или другие параметры grep, но также хотите увидеть видимую замену символа табуляции, вы можете достичь этого с помощью

grep -[options] -P '\t' file_name | sed 's/\t/\*\*\*\*/g'

В качестве примера:

$ echo "A\tB\nfoo\tbar" > test
$ grep -inH -P '\t' test | sed 's/\t/\*\*\*\*/g'
test:1:A****B
test:2:foo****bar

EDIT: Очевидно, что вышеизложенное полезно только для просмотра содержимого файла для поиска вкладок --- если целью является обработка вкладок как часть более крупного сеанса сценариев, это не служит никакой полезной цели.

gruic · Answer 16 · 2015-07-23T18-41-00.000Z

Это хорошо работает для AIX. Я ищу строки, содержащие JOINED<\t>ACTIVE

voradmin cluster status | grep  JOINED$'\t'ACTIVE

 vorudb201   1       MEMBER(g) JOINED        ACTIVE
*vorucaf01   2       SECONDARY JOINED        ACTIVE

AIXroot · Answer 17 · 2014-02-03T11-52-00.000Z

В ksh я использовал

grep "[^I]" testfile

YullyBear · Answer 18 · 2013-04-04T13-59-00.000Z

Ответ проще. Напишите свой grep и в типе цитаты введите ключ вкладки, он работает хорошо, по крайней мере, в ksh

grep "  " *

сначала вам нужно суметь ввести символ TAB в вашей оболочке - большинство оболочек интерпретирует этот ключ как команду (завершение)

ghostdog74 · Answer 19 · 2009-12-01T13-42-00.000Z

используйте gawk, установите разделитель полей на вкладку (\ t) и проверьте количество полей. Если более 1, то есть /- вкладки

awk -F"\t" 'NF>1' file

количество полей. пожалуйста, прочитайте gawk doc, чтобы понять больше.
Это немного излишне, и пропускает вопрос. awk /\t/ достаточно для вопроса оп.

Accidental brine · Answer 20 · 2015-02-12T21-27-00.000Z

Вы можете ввести

grep \t foo

или

grep '\t' foo

для поиска символа табуляции в файле foo. Возможно, вы также можете использовать другие коды эвакуации, хотя я тестировал только \n. Хотя это довольно трудоемко и непонятно, зачем вам нужно, в zsh вы также можете ввести символ табуляции, вернуться к началу, grep и заключить вкладку с кавычками.

Caio Argolo · Answer 21 · 2015-06-03T19-46-00.000Z

Ищите пробелы много раз [[: space:]] *

grep [[: space:]] * '.' '.'

найдет что-то вроде этого:

'вкладка..

Это одинарные кавычки ('), а не double (").
Так вы делаете конкатенацию в grep. = -)