как удалить первые два столбца в файле с помощью оболочки (awk, sed, что угодно)

Question

как удалить первые два столбца в файле с помощью оболочки (awk, sed, что угодно)

52

У меня есть файл со многими строками в каждой строке есть много столбцов (полей), разделенных пробелом "" количество столбцов в каждой строке различно Я хочу удалить первые два столбца как?

wenzi 19 нояб. 2012, в 01:10

Источник

0

Возможный дубликат использования awk для печати всех столбцов от n-го до последнего
Ciro Santilli 新疆改造中心六四事件法轮功 12 янв. 2019, в 20:24

Теги:

shell

perl

awk

sed

cut

10 ответов

Ещё вопросы

Возможный дубликат использования awk для печати всех столбцов от n-го до последнего

sampson-chen · Answer 1 · 2012-11-19T01-08-00.000Z

Вы можете сделать это с помощью cut:

cut -d " " -f 3- input_filename > output_filename

Объяснение:

cut: вызвать команду cut
-d " ": в качестве разделителя используйте единое пространство (cut использует TAB по умолчанию)
-f: укажите поля для сохранения
3-: все поля, начинающиеся с поля 3
input_filename: используйте этот файл как вход
> output_filename: напишите вывод в этот файл.

В качестве альтернативы вы можете сделать это с помощью awk:

awk '{$1=""; $2=""; sub("  ", " "); print}' input_filename > output_filename

Объяснение:

awk: вызывать команду awk
$1=""; $2="";: установите поле 1 и 2 в пустую строку
sub(...);: очистить выходные поля, потому что поля 1 и 2 все равно будут разделены символом ""
print: напечатать измененную строку
input_filename > output_filename: то же, что и выше.

вторая работает, первая не работает, спасибо
@wenzi Упс, забыл, что по умолчанию cut использует табуляцию в качестве разделителя. Смотрите обновленный ответ - только что проверил и все работает. при прочих равных я бы порекомендовал использовать cut over awk .
Вы можете сделать это в awk просто awk '{sub(/([^ ]+ ){2}/, "")}1' . Я согласен, что сокращение - лучший выбор, если у вас есть разделитель поля с одним символом.
осталось еще несколько пробелов, используйте awk '{$1=""; $2=""; sub(/^ +/, ""); print}' вместо или короче awk '{$1=$2=""; sub(/^ +/, "")}1'

raychi · Answer 2 · 2013-02-05T19-44-00.000Z

Вот один из способов сделать это с Awk, который относительно легко понять:

awk '{print substr($0, index($0, $3))}'

Это простая команда awk без шаблона, поэтому действие внутри {} выполняется для каждой строки ввода.

Действие состоит в том, чтобы просто напечатать подстроку, начиная с позиции третьего поля.

$0: вся строка ввода
$3: 3-е поле
index(in, find): возвращает позицию find в строке in
substr(string, start): вернуть подстроку, начинающуюся с индекса start

Если вы хотите использовать другой разделитель, например запятую, вы можете указать его с опцией -F:

awk -F"," '{print substr($0, index($0, $3))}'

Вы также можете использовать это в подмножестве входных строк, указав шаблон перед действием в {}. Только строки, соответствующие шаблону, будут выполняться.

awk 'pattern{print substr($0, index($0, $3))}'

Где шаблон может быть таким, как:

/abcdef/: использовать регулярное выражение, по умолчанию работает по $0.
$1 ~ /abcdef/: работайте в определенном поле.
$1 == blabla: используйте сравнение строк
NR > 1: использовать запись/номер строки
NF > 0: использовать поле/номер столбца

Спасибо за это, это более хороший ответ, чем принятый IMO
Как насчет удаления последних 2 столбцов, считая с обратного?
Это не будет работать правильно, если поле № 2 и поле № 3 имеют одинаковое содержимое.

Felipe Alvarez · Answer 3 · 2014-07-07T02-39-00.000Z

Спасибо за сообщение вопроса. Я также хотел бы добавить script, который помог мне.

awk '{ $1=""; print $0 }' file

В этом случае Awk не сохраняет разделители полей.

Steven Penny · Answer 4 · 2014-11-18T07-02-00.000Z

8

awk '{$1=$2="";$0=$0;$1=$1}1'

Ввод

a b c d

Выход

c d

Steven Penny 18 нояб. 2014, в 07:02

0

не могли бы вы объяснить? :) я не понимаю, зачем нужны $0=$0;$1=$1 для исчезновения пробелов
jirislav 09 янв. 2018, в 11:34

technosaurus · Answer 5 · 2014-07-07T02-23-00.000Z

6

Довольно просто сделать это только с оболочкой

while read A B C; do
echo "$C"
done < oldfile >newfile

technosaurus 07 июль 2014, в 02:23

0

Это отличный ответ, однако вы захотите использовать read -r вместо read .
robert 13 дек. 2017, в 21:10
0

read -r сохранит обратную косую черту. read не буду. Например: echo "foo ba\r" выдаст вывод foo ba\r . Тем не менее, echo "foo ba\r" | (while read first_column second_column; do echo "$second_column"; done) будет выводить только bar в качестве вывода (с удаленной обратной косой чертой. Добавление флага -r приводит к правильному выводу ba\r
robert 13 дек. 2017, в 21:11

Jonathan Leffler · Answer 6 · 2012-11-19T02-54-00.000Z

Вы можете использовать sed:

sed 's/^[^ ][^ ]* [^ ][^ ]* //'

Это ищет строки, начинающиеся с одного или более не-пробелов, пробела, другого набора из одного или нескольких незабитых и еще одного пустого и удаляет сопоставленный материал, например первые два поля. [^ ][^ ]* немного короче эквивалентной, но более явной нотации [^ ]\{1,\}, а вторая может столкнуться с проблемами с GNU sed (хотя, если вы используете --posix в качестве опции, даже GNU sed не может нафиг это). OTOH, если класс символов, который должен быть повторен, был более сложным, числовая нотация выигрывает для краткости. Его легко расширить, чтобы обрабатывать "пустую или табуляцию" как разделитель, или "множественные пробелы" или "множественные пробелы или вкладки". Он также может быть изменен для обработки необязательных заготовок (или вкладок) перед первым полем и т.д.

Для awk и cut см. Sampson-Chen ответ. Существуют и другие способы записи awk script, но они не намного лучше, чем ответ. Обратите внимание, что вам может потребоваться явно задать разделитель полей (-F" ") в awk, если вы не хотите, чтобы вкладки обрабатывались как разделители или у вас могло быть несколько пробелов между полями. Стандарт POSIX cut не поддерживает множественные разделители между полями; GNU cut имеет полезную, но нестандартную опцию -i, позволяющую использовать несколько разделителей между полями.

Вы также можете сделать это в чистой оболочке:

while read junk1 junk2 residue
do echo "$residue"
done < in-file > out-file

Если residue может содержать обратную косую черту, приведенное выше чтение будет интерпретировать его, а не воспроизводить его в выходных данных. Всегда используйте, while IFS= read -r ...
Если bash интерпретирует содержимое с простым read , то bash работает (снова). Команда чтения в оригинальных оболочках не делала такой ерунды; Я не верю, что это требуется оболочкой POSIX. Меня раздражало бы, что bash делает то, что вы говорите, - у меня уже есть отношения любовь / ненависть с программой, поскольку она делает много вещей хорошо, но есть некоторые вещи, которые она делает плохо, и изменение устаревшего поведения является одним из худших, и требование опции для включения старого стандартного поведения ... очень раздражает. Кажется, ты прав; bash завален!
Это поведение POSIX, см. Pubs.opengroup.org/onlinepubs/9699919799/utilities/read.html .
Я вижу, что я не сказал это явно, но причина, по которой вам нужен IFS =, состоит в том, что если первое поле во входных данных было пустым, то при расщеплении поля по умолчанию начальные пробелы будут удалены, поэтому residue будет начинаться с поля 4 (или позже) вместо поля 3.
Блин ... OK; POSIX не работает, но bash следует POSIX 2008. Я никогда не хотел этой функциональности в программировании оболочки более четверти века, но я думаю, что я в меньшинстве.

Vijay · Answer 7 · 2014-12-10T10-08-00.000Z

Perl:

perl -lane 'print join(' ',@F[2..$#F])' File

AWK:

awk '{$1=$2=""}1' File

potong · Answer 8 · 2012-11-19T09-12-00.000Z

Это может сработать для вас (GNU sed):

sed -r 's/^([^ ]+ ){2}//' file

или для столбцов, разделенных одним или несколькими пробелами:

sed -r 's/^(\S+\s+){2}//' file

Carlos · Answer 9 · 2017-12-20T19-44-00.000Z

Используя awk и, основываясь на некоторых из приведенных ниже опций, использование цикла for делает немного более гибким; иногда я могу удалить первые 9 столбцов (например, я делаю "ls -lrt" ), поэтому я меняю 2 на 9 и что он:

awk '{ for(i=0;i++<2;){$i=""}; print $0 }' your_file.txt

Holger Brandl · Answer 10 · 2017-05-12T09-07-00.000Z

Используйте kscript

kscript 'lines.split().select(-1,-2).print()' file