Распечатать файл, пропустив первые X строк в Bash

Question

Распечатать файл, пропустив первые X строк в Bash

420

У меня очень длинный файл, который я хочу распечатать, но пропуская первые строки 1e6, например. Я заглядываю в страницу кошачьего мужа, но я не видел возможности этого сделать. Я ищу команду для этого или простую программу bash.

Eduardo 03 март 2009, в 00:49

Источник

Теги:

bash

printing

linux

skip

13 ответов

85

Если у вас есть хвост GNU в вашей системе, вы можете сделать следующее:

tail -n +1000001 huge-file.log

Это символ +, который делает то, что вы хотите. Процитировать с man-страницы:

Если первый символ K (количество байтов или строк) является `+ ', начните с элемента Kth с начала каждого файла.

Таким образом, как отмечено в комментарии, добавление +1000001 начинает печать с первого элемента после первых 1 000 000 строк.

Eddie 03 март 2009, в 04:27

0

Работает и для хвоста BSD (OS X)
Lloeki 17 нояб. 2016, в 13:59

72

Самый простой способ найти первые десять строк файла:

$ sed 1,10d file.txt

David Parks 17 окт. 2012, в 09:09

11

В более общем случае вам придется использовать sed 1,Xd где X - количество удаляемых начальных строк, где X больше 1.
A-B-B 24 дек. 2013, в 00:10
0

Это имеет больше смысла, если вы не знаете, как долго файл и не хотите, чтобы tail печатал последние 100000000 строк.
springloaded 29 авг. 2018, в 15:06

23

Менее сложная версия с AWK:

awk 'NR > 1e6' myfile.txt

Но я бы рекомендовал использовать целые числа.

newtover 26 апр. 2013, в 15:29

5

полезно, если вам нужно пропустить несколько строк в середине файла, например, awk '!(5 < NR && NR < 10)'
arekolek 28 июль 2016, в 12:24

13

Просто предложите альтернативу sed.:) Чтобы пропустить первый миллион строк, попробуйте |sed '1,1000000d'.

Пример:

$ perl -wle 'print for (1..1_000_005)'|sed '1,1000000d'
1000001
1000002
1000003
1000004
1000005

tuomassalo 26 янв. 2012, в 07:06

1

@ Марлон, прости, но это не так. Это работает только для 1d. Если, например, вы используете его на 2d, вы удалите только строку 2. Он не удалит диапазон строк.
A-B-B 24 дек. 2013, в 17:19
0

@ABB извините, хотел сказать, что это было самое простое решение, поэтому я +1 не пытался исправить автора.
Marlon 14 янв. 2014, в 19:40

12

если вы хотите пропустить первые две строки
tail -n +3 <filename>

если вы хотите пропустить первую строку x
tail -n +$((x+1)) <filename>

saipraneeth 09 июль 2013, в 19:36

2

Это несколько вводит в заблуждение, потому что кто-то может интерпретировать (x+1) буквально. Например, для x = 2 они могут вводить либо (2+1) либо даже (3) , ни один из которых не будет работать. Лучший способ написать это может быть: Чтобы пропустить первые X строк, с Y = X + 1, используйте tail -n +Y <filename>
A-B-B 24 дек. 2013, в 17:11

12

Если вы хотите увидеть первые 10 строк, вы можете использовать sed, как показано ниже:

sed -n '1,10 p' myFile.txt

или если вы хотите видеть строки от 20 до 30, вы можете использовать:

sed -n '20,30 p' myFile.txt

Kadir YILDIZ 20 дек. 2012, в 10:39

10

Эта оболочка script отлично работает для меня:

#!/bin/bash
awk -v initial_line=$1 -v end_line=$2 '{
    if (NR >= initial_line && NR <= end_line) 
    print $0
}' $3

Используется с этим образцом файла (file.txt):

one
two
three
four
five
six

Команда (она будет извлекаться со второй по четвертую строку в файле):

edu@debian5:~$./script.sh 2 4 file.txt

Вывод этой команды:

two
three
four

Конечно, вы можете улучшить его, например, тестируя, что все значения аргументов являются ожидаемыми: -)

sourcerebels 31 март 2009, в 14:37

1

++ для использования awk, который немного более переносим, чем tail
guns 31 март 2009, в 13:42

8

Используйте команду sed delete с адресом диапазона. Например:

$ sed 1,100d file.txt # Print file.txt omitting lines 1-100.

В качестве альтернативы, если вы хотите только напечатать известный диапазон, используйте команду печати с флагом -n:

$ sed -n 201,300p file.txt # Print lines 201-300 from file.txt

Это решение должно работать надежно во всех UNIX-системах независимо от наличия утилит GNU.

maerics 02 дек. 2016, в 17:09

1

Наиболее удобный для использования ответ как для клиентов, так и для сценариев.
cerd 01 дек. 2017, в 01:37

5

Вы можете сделать это, используя команды head и tail:

head -n <num> | tail -n <lines to print>

где num - 1e6 + количество строк, которые вы хотите распечатать.

Dana the Sane 03 март 2009, в 04:22

3

Не самый эффективный ответ, так как вам нужно сделать «wc -l» для файла, чтобы получить количество строк, а затем добавить миллион :-). Вы можете сделать это только с "хвостом".
paxdiablo 03 март 2009, в 02:43
0

Я не уверен, я понимаю, что 1e6 будет известно во время вызова. Отсчет назад не самый быстрый, хотя.
Dana the Sane 03 март 2009, в 03:11

3

cat < File > | awk '{if(NR > 6) print $0}'

aamadeo 21 нояб. 2012, в 21:22

0

Это синтаксическая ошибка в bash - в какой оболочке это работает?
G-Man 18 май 2017, в 04:51
0

Я запускаю это в Bash. <И> не являются частью команды, имя файла должно заменять «<File>»
aamadeo 19 май 2017, в 13:37
0

awk 'NR > 6 {print}' достаточно ... нет необходимости для if или $ 0.
CSTobey 09 янв. 2019, в 20:45

Показать ещё 1 комментарий

2

sed -n '1d;p'

эта команда удалит первую строку и выведет остальные

Soroush Pouryazdian 03 авг. 2018, в 16:48

-1

Мне нужно было сделать то же самое и найти этот поток.

Я попробовал "tail -n +", но он просто распечатал все.

Чем больше + строк хорошо работало в подсказке, но оказалось, что при работе в режиме безголовки (cronjob) он выглядел совершенно иначе.

Я, наконец, написал это сам:

skip=5
FILE="/tmp/filetoprint"
tail -n$((`cat "${FILE}" | wc -l` - skip)) "${FILE}"

frater 28 май 2009, в 18:24

0

слишком сложно
Vladislavs Dovgalecs 13 март 2015, в 22:23
0

Правильная ссылка на награду « Бесполезное использование кошек» . Предыдущее заменяется рекламой.
kub1x 26 июль 2017, в 13:01
1

@ kub1x Я не думаю, что «cat» здесь бесполезен, поскольку «cat | wc -l» выдает другой вывод, чем простой «wc -l». Первый подходит для арифметических операций, второй - нет.
Jack 15 янв. 2018, в 10:14
0

@ Джек Я не судил об использовании cat , а только исправлял ссылку в комментарии, которая приводила к мертвой странице. Исходный комментарий должен быть удален. В любом случае, спасибо за указание на это.
kub1x 15 янв. 2018, в 11:55
1

@ kub1x Знаешь? После прочтения ссылки теперь я думаю, что использование «cat» здесь неправильно :) Это должно было быть что-то вроде «wc -l <$ {FILE}», экономя некоторое время и память (создание нового процесса, конвейеризация I / О, ..) Спасибо, я узнал что-то новое
Jack 16 янв. 2018, в 09:43

Показать ещё 3 комментария

Ещё вопросы

В более общем случае вам придется использовать sed 1,Xd где X - количество удаляемых начальных строк, где X больше 1.
Это имеет больше смысла, если вы не знаете, как долго файл и не хотите, чтобы tail печатал последние 100000000 строк.
полезно, если вам нужно пропустить несколько строк в середине файла, например, awk '!(5 < NR && NR < 10)'
@ Марлон, прости, но это не так. Это работает только для 1d. Если, например, вы используете его на 2d, вы удалите только строку 2. Он не удалит диапазон строк.
@ABB извините, хотел сказать, что это было самое простое решение, поэтому я +1 не пытался исправить автора.
Это несколько вводит в заблуждение, потому что кто-то может интерпретировать (x+1) буквально. Например, для x = 2 они могут вводить либо (2+1) либо даже (3) , ни один из которых не будет работать. Лучший способ написать это может быть: Чтобы пропустить первые X строк, с Y = X + 1, используйте tail -n +Y <filename>
++ для использования awk, который немного более переносим, чем tail
Наиболее удобный для использования ответ как для клиентов, так и для сценариев.
Не самый эффективный ответ, так как вам нужно сделать «wc -l» для файла, чтобы получить количество строк, а затем добавить миллион :-). Вы можете сделать это только с "хвостом".
Я не уверен, я понимаю, что 1e6 будет известно во время вызова. Отсчет назад не самый быстрый, хотя.
Это синтаксическая ошибка в bash - в какой оболочке это работает?
Я запускаю это в Bash. <И> не являются частью команды, имя файла должно заменять «<File>»
awk 'NR > 6 {print}' достаточно ... нет необходимости для if или $ 0.
Правильная ссылка на награду « Бесполезное использование кошек» . Предыдущее заменяется рекламой.
@ kub1x Я не думаю, что «cat» здесь бесполезен, поскольку «cat | wc -l» выдает другой вывод, чем простой «wc -l». Первый подходит для арифметических операций, второй - нет.
@ Джек Я не судил об использовании cat , а только исправлял ссылку в комментарии, которая приводила к мертвой странице. Исходный комментарий должен быть удален. В любом случае, спасибо за указание на это.
@ kub1x Знаешь? После прочтения ссылки теперь я думаю, что использование «cat» здесь неправильно :) Это должно было быть что-то вроде «wc -l <$ {FILE}», экономя некоторое время и память (создание нового процесса, конвейеризация I / О, ..) Спасибо, я узнал что-то новое

SingleNegationElimination · Accepted Answer · 2009-03-03T03-31-00.000Z

Вам понадобится хвост. Некоторые примеры:

$ tail great-big-file.log
< Last 10 lines of great-big-file.log >

Если вам действительно нужно пропустить определенное количество "первых" строк, используйте

$ tail -n +<N+1> <filename>
< filename, excluding first N lines. >

То есть, если вы хотите пропустить N строк, вы начинаете печатать строку N + 1. Пример:

$ tail -n +11 /tmp/myfile
< /tmp/myfile, starting at line 11, or skipping the first 10 lines. >

Если вы хотите просто увидеть последние строки, опустите "+":

$ tail -n <N> <filename>
< last N lines of file. >

Или "tail --lines = + <LinesToSkip> ..." для толпы читаемых команд :-)
в centos 5.6 tail -n +1 показывает весь файл, а tail -n +2 пропускает первую строку. странный. То же самое для tail -c +<num> .
Ник, возможно, вы сталкиваетесь с окончаниями строк в стиле Windows.
@JoelClark Нет, @NickSoft прав. В Ubuntu это tail -n +<start number> , я только что проверил. Таким образом, tail -n +1 ничего не пропустит, но вместо этого начните с первой строки.
Я могу подтвердить, что tail -n +2 необходим для пропуска первой строки в Darwin / Mac OS X.
это должно быть устаревшим, но работает tail -n + 2 ИЛИ tail -n +2, так как со всеми короткими командами, использующими getopt, вы можете запустить параметр прямо рядом с его переключателем, при условии, что переключатель является последним в группе, очевидно, такая команда, как tail -nv + 2, не будет работать, она должна быть tail -vn + 2. если ты мне не веришь, попробуй сам.
В Solaris вам необходимо использовать: /usr/xpg4/bin/tail (это можно найти на странице руководства).