Слишком длинный список аргументов для команд rm, cp, mv

Question

Слишком длинный список аргументов для команд rm, cp, mv

330

У меня есть несколько сотен PDF файлов под каталогом в UNIX. Имена файлов PDF очень длинные (около 60 символов).

Когда я пытаюсь удалить все файлы PDF вместе, используя следующую команду:

rm -f *.pdf

Я получаю следующую ошибку:

/bin/rm: cannot execute [Argument list too long]

Каково решение этой ошибки? Происходит ли эта ошибка для команд mv и cp? Если да, как решить эту команду?

Nik 02 июль 2012, в 08:49

Источник

17

Вы можете найти эту ссылку полезной
another.anon.coward 02 июль 2012, в 07:54
0

related: Решение «mv: список аргументов слишком длинный»?
jfs 24 апр. 2016, в 09:49
0

Также это может быть актуально http://mywiki.wooledge.org/BashFAQ/095
Lorenzo Belli 01 июнь 2017, в 10:46
0

Stack Overflow - сайт для вопросов программирования и разработки. Этот вопрос, кажется, не по теме, потому что он не о программировании или разработке. Смотрите, какие темы я могу задать здесь, в Справочном центре. Возможно, лучше спросить Super User или Unix & Linux Stack Exchange .
jww 01 янв. 2018, в 04:01
2

@jww: И я продолжал думать, что bash подпадает под «программные инструменты, обычно используемые программистами» - категорию, вопросы которой можно задавать здесь!
Vicky 02 янв. 2018, в 07:18
0

@Nik - Добавление "... в сценарии" не является убедительным. Когда проблема сводится к примеру Minimal, Complete и Verifiable , это просто вопрос о том, как выполнить команду. Мои извинения, если я что-то упускаю очевидное.
jww 02 янв. 2018, в 07:19
0

@jww: не "как запустить команду" ... а "как запустить эту конкретную команду без получения ошибки, которую я получаю" ... нет?
Vicky 02 янв. 2018, в 07:22

Показать ещё 5 комментариев

Теги:

linux

unix

22 ответа

213

TL;DR

Это ограничение ядра по размеру аргумента командной строки. Вместо этого используйте цикл for.

Происхождение проблемы

Это системная проблема, связанная с константой execve и ARG_MAX. Существует много документации по этому поводу (см. man execve, debian wiki).

В принципе, расширение создает команду (с ее параметрами), которая превышает предел ARG_MAX. В ядре 2.6.23 предел был установлен в 128 kB. Эта константа была увеличена, и вы можете получить ее значение, выполнив:

getconf ARG_MAX
# 2097152 # on 3.5.0-40-generic

Решение

Используйте цикл for, как рекомендуется на BashFAQ/095, и нет ограничений, кроме RAM/памяти:

for f in *.pdf; do rm "$f"; done

Также это переносимый подход, поскольку glob имеет сильное и последовательное поведение среди оболочек (часть спецификации POSIX).

Если вы настаиваете, вы можете использовать find, но на самом деле не использовать xargs, поскольку он "опасен (сломан, эксплуатируется и т.д.) при чтении не-NUL-ограниченного ввода":

find . -name '*.pdf' -exec rm {} +

Ссылки

Édouard Lopez 06 сен. 2013, в 00:08

21

Отличный ответ, так нужно отвечать на все вопросы. Спасибо!
tommed 09 апр. 2015, в 08:32
0

+1 за упоминание цикла for . Раньше я использовал find , но я всегда смотрю, как это сделать, так как я постоянно забываю опции и т. Д. for кажется легче вспомнить ИМХО
Robert Dundon 10 фев. 2017, в 20:05
1

Использовал его как for f in *; do rm "$f"; done работу как очарование
abdul qayyum 16 март 2017, в 04:48
0

Решение for цикла фактически спасло меня!
AJ Hsu 23 дек. 2017, в 14:21
3

Решение find -exec кажется НАМНОГО быстрее, чем цикл for .
threeve 19 март 2018, в 18:08
0

цикл for мучительно медленный. попробовал это на директории с более чем 100 000 файлами, а через 30 секунд он удалил только 12 000 или около того. Пробовал find версию и это было сделано за полсекунды
billynoah 13 сен. 2018, в 18:35
2

Пять лет спустя на 4.15.0 ( 4.15.0-1019-gcp ), и предел все еще на 2097152. Интересно, что поиск ARG_MAX в 4.15.0-1019-gcp linux дает результат, показывающий, что ARG_MAX на 131702.
Matt M. 18 сен. 2018, в 05:01
0

Решение для цикла for намного медленнее, чем решение find.
jdhao 24 окт. 2018, в 08:34

Показать ещё 6 комментариев

153

find имеет действие -delete:

find . -maxdepth 1 -name '*.pdf' -delete

ThiefMaster 02 июль 2012, в 23:39

4

Это все равно вернет «Список аргументов слишком длинный». По крайней мере, для меня это так. Использование xargs , согласно ответу Денниса, работает как задумано.
Sergio 28 май 2014, в 16:33
7

Это звучит как ошибка в поиске.
ThiefMaster 28 май 2014, в 17:30
0

Это работало для меня, в отличие от xargs …: o
Levi Figueira 10 окт. 2014, в 20:45
3

У @Sergio была та же самая проблема, это было вызвано отсутствующими кавычками вокруг образца имени.
Luxian 01 май 2015, в 21:00
0

аааа, почему инструмент для поиска вещей даже имеет переключатель для удаления? неужели только я считаю ненужным, мягко говоря, и опасным.
mathreadler 12 март 2016, в 07:29
0

Ты дно. Спасибо
Fatih Aytekin 30 нояб. 2016, в 14:21
1

@mathreadler Рассматривает тот факт, что распространенным вариантом использования -exec является удаление группы файлов. -exec rm {} + будет делать то же самое, но все равно требует запуска хотя бы одного внешнего процесса. -delete позволяет find просто выполнять необходимые системные вызовы самостоятельно, без использования внешней оболочки.
chepner 05 дек. 2016, в 16:12

Показать ещё 5 комментариев

15

Другой ответ - заставить xargs обрабатывать команды в партиях. Например, в delete файлы 100 за раз, cd в каталог и запустите это:

echo *.pdf | xargs -n 100 rm

portforwardpodcast 04 март 2015, в 11:41

4

Для удаления команды в Linux, которая может быть катастрофой, если вы инженер и ввели ошибку, я считаю, что это «самый безопасный и я знаю, что происходит», это лучший вариант. Не то, что если вы пропустите ввод точки, ваша компания потерпит крах за одну минуту.
ArtificiallyIntelligence 13 июнь 2016, в 21:19
1

Как мы можем сделать это расширением по умолчанию для определенных команд? Существует множество «стандартных» команд linux, в которых известно, нужны ли они всем сразу или нет (например, «rm»)
user1212212 19 июль 2016, в 17:27
1

Обратите внимание, что это работает только тогда, когда echo является встроенной оболочкой. Если вы в конечном итоге используете команду echo , вы все равно столкнетесь с ограничением аргументов программы.
Toby Speight 05 дек. 2016, в 16:03

Показать ещё 1 комментарий

8

Или вы можете попробовать:

find . -name '*.pdf' -exec rm -f {} \;

Jon Lin 02 июль 2012, в 08:31

0

Это также удаляет файлы из подкаталогов. Как это предотвратить?
Vicky 02 июль 2012, в 08:09
0

@NikunjChauhan Добавить опцию -maxdepth: find . -maxdepth 1 -name '*.pdf' -exec rm -f {} \;
Jon Lin 02 июль 2012, в 08:19
0

Я не могу вставить опцию maxdepth
Vicky 02 июль 2012, в 08:51
0

Эта опция может быть опцией только для Linux, как указано выше в ответе @ Dennis (выбранный ответ).
jvriesem 13 окт. 2014, в 21:04

Показать ещё 2 комментария

6

Вы можете использовать массив bash:

files=(*.pdf)
for((I=0;I<${#files[*]};I+=1000)); do rm -f ${files[@]:I:1000}; done

Таким образом, он будет удалять пакеты по 1000 файлов на каждый шаг.

danjperron 18 март 2014, в 18:03

1

Для большого количества файлов это кажется значительно быстрее
James Tocknell 01 июнь 2016, в 04:19

5

вы можете использовать эту оценку

find -name "*.pdf"  -delete

Sarath Ak 08 сен. 2016, в 07:06

5

вы можете попробовать следующее:

for f in *.pdf
do
  rm $f
done

EDIT: Комментарий ThiefMaster предлагает мне не раскрывать такую опасную практику молодым оболочка jedis, поэтому я добавлю более "безопасную" версию (ради сохранения вещей, когда у кого-то есть файл "-rf...pdf" )

echo "# Whooooo" > /tmp/dummy.sh
for f in '*.pdf'
do
   echo "rm -i $f" >> /tmp/dummy.sh
done

После запуска выше, просто откройте файл /tmp/dummy.sh в своем fav. редактор и проверять каждую строку для опасных имен файлов, комментируя их, если они найдены.

Затем скопируйте dummy.sh script в свой рабочий каталог и запустите его.

Все это по соображениям безопасности.

BigMike 02 июль 2012, в 08:16

5

Я думаю, что это будет действительно хорошо с файлом с именем, например, -rf .. .pdf
ThiefMaster 02 июль 2012, в 22:38
0

да, но, как правило, при использовании в оболочке издатель команды «должен» посмотреть, что он делает :). На самом деле я предпочитаю перенаправить в файл, а затем проверять каждую строку.
BigMike 03 июль 2012, в 08:17
1

Это не цитата "$ f". Это то, о чем говорил ThiefMaster. -rf имеет приоритет над -i , так что ваша вторая версия не лучше (без проверки вручную). И в принципе бесполезно для массового удаления, потому что подсказки для каждого файла.
Peter Cordes 26 июль 2015, в 03:23

Показать ещё 1 комментарий

3

Если они являются именами файлов с пробелами или специальными символами, используйте:

find -maxdepth 1 -name '*.pdf' -exec rm "{}" \;

Это предложение ищет все файлы в текущем каталоге (-maxdepth 1) с расширением pdf (-name '*.pdf'), а затем удаляет каждый из них (-exec rm "{}" ).

Выражение {} заменит имя файла, а "{}" задает имя файла как строку, включая пробелы или специальные символы.

Alejandro Salamanca Mazuelo 09 июнь 2016, в 16:57

0

Хотя этот фрагмент кода может решить вопрос, в том числе объяснение того, как и почему это решает проблему , действительно поможет улучшить качество вашего сообщения. Помните, что вы отвечаете на вопрос для читателей в будущем, а не только для того, кто спрашивает сейчас! Пожалуйста, отредактируйте свой ответ, чтобы добавить объяснение и указать, какие ограничения и предположения применяются.
Toby Speight 05 дек. 2016, в 16:11

3

Команда rm имеет ограничение на файлы, которые вы можете удалить одновременно.

Одна возможность вы можете удалить их, используя несколько раз базы команд rm в ваших шаблонах файлов, например:

rm -f A*.pdf
rm -f B*.pdf
rm -f C*.pdf
...
rm -f *.pdf

Вы также можете удалить их через команду find:

find . -name "*.pdf" -exec rm {} \;

Fabio Farath 29 авг. 2014, в 17:23

1

Нет, rm не имеет такого ограничения на количество файлов, которые он будет обрабатывать (кроме того, его argc не может быть больше, чем INT_MAX ). Это ограничение ядра на максимальный размер всего массива аргументов (поэтому длина имен файлов значительна).
Toby Speight 18 июнь 2018, в 10:27

3

i столкнулась с такой же проблемой при копировании исходного каталога исходного кода в пункт назначения

исходный каталог имел файлы ~ 3 lakcs

я использовал cp с опцией -r, и это сработало для меня

cp -r abc/def/

он скопирует все файлы из abc в def без слишком долгого предупреждения о списке аргументов

user3405020 11 март 2014, в 08:35

0

Я не знаю, почему кто-то отрицал это, даже не комментируя это (это политика, ребята!). Мне нужно было удалить все файлы внутри папки (вопрос не к PDF-файлам, обратите внимание), и для этого этот трюк работает хорошо, в конце концов все, что нужно сделать, это воссоздать папку, которая была удалена, когда Я использовал `rm -R / path / to / folder".
Thomas Tempelmann 07 авг. 2014, в 11:57
1

Это работает, потому что в случае с OP он использовал *, который расширился до огромного списка .pdf, давая каталог, который будет обрабатывать это внутренне, таким образом, не имея дело с проблемой OP. Я думаю, что по этой причине было отклонено. Он может быть недоступен для OP, если у него есть вложенный каталог или другие файлы (не pdf) в его каталоге
Alvein 23 окт. 2015, в 07:40

2

Я столкнулся с этой проблемой несколько раз. Многие из решений будут запускать команду rm для каждого отдельного файла, который необходимо удалить. Это очень неэффективно:

find . -name "*.pdf" -print0 | xargs -0 rm -rf

В итоге я написал python script для удаления файлов на основе первых 4 символов в имени файла:

import os
filedir = '/tmp/' #The directory you wish to run rm on 
filelist = (os.listdir(filedir)) #gets listing of all files in the specified dir
newlist = [] #Makes a blank list named newlist
for i in filelist: 
    if str((i)[:4]) not in newlist: #This makes sure that the elements are unique for newlist
        newlist.append((i)[:4]) #This takes only the first 4 charcters of the folder/filename and appends it to newlist
for i in newlist:
    if 'tmp' in i:  #If statment to look for tmp in the filename/dirname
        print ('Running command rm -rf '+str(filedir)+str(i)+'* : File Count: '+str(len(os.listdir(filedir)))) #Prints the command to be run and a total file count
        os.system('rm -rf '+str(filedir)+str(i)+'*') #Actual shell command
print ('DONE')

Это работало очень хорошо для меня. Я смог очистить более 2 000 файлов temp в папке примерно через 15 минут. Я прокомментировал tar из небольшого числа кода, поэтому любой, обладающий минимальным знанием питона, может манипулировать этим кодом.

Pedro Montero 04 фев. 2015, в 19:11

1

Попробуйте это также. Если вы хотите удалить более 30/90 дней (+) или еще ниже 30/90 (-) дней файлов/папок, вы можете использовать приведенные ниже команды ex

Ex: В течение 90 дней исключается выше после того, как удалены файлы/папки 90 дней, это означает 91,92.... 100 дней

find <path> -type f -mtime +90 -exec rm -rf {} \;

Пример: для последних 30 дней файлов, которые вы хотите удалить, используйте следующую команду (-)

find <path> -type f -mtime -30 -exec rm -rf {} \;

Если вы хотите giz файлы для файлов более чем на 2 дня

find <path> -type f -mtime +2 -exec gzip {} \;

Если вы хотите просмотреть файлы/папки только за последний месяц. Пример:

find <path> -type f -mtime -30 -exec ls -lrt {} \;

Выше 30 дней больше, а затем список файлов/папок Пример:

find <path> -type f -mtime +30 -exec ls -lrt {} \;

find /opt/app/logs -type f -mtime +30 -exec ls -lrt {} \;

raja 06 окт. 2017, в 10:30

1

Я обнаружил, что для чрезвычайно больших списков файлов ( > 1e6) эти ответы были слишком медленными. Вот решение, использующее параллельную обработку в python. Я знаю, я знаю, это не linux... но больше ничего здесь не сработало.

(Это сэкономило мне часы)

# delete files
import os as os
import glob
import multiprocessing as mp

directory = r'your/directory'
os.chdir(directory)


files_names = [i for i in glob.glob('*.{}'.format('pdf'))]

# report errors from pool

def callback_error(result):
    print('error', result)

# delete file using system command
def delete_files(file_name):
     os.system('rm -rf ' + file_name)

pool = mp.Pool(12)  
# or use pool = mp.Pool(mp.cpu_count())


if __name__ == '__main__':
    for file_name in files_names:
        print(file_name)
        pool.apply_async(delete_files,[file_name], error_callback=callback_error)

mmann1123 25 июль 2017, в 02:19

1

Я знаю только об этом. Идея состоит в том, чтобы экспортировать этот список файлов PDF, которые у вас есть, в файл. Затем разделите этот файл на несколько частей. Затем удалите pdf файлы, перечисленные в каждой части.

ls | grep .pdf > list.txt
wc -l list.txt

wc -l - подсчитать, сколько строк содержится в файле list.txt. Когда у вас есть представление о том, как долго это происходит, вы можете решить разделить его на полтора-четвертого или что-то еще. Использование команды split -l Например, разделите его по 600 строк.

split -l 600 list.txt

это создаст несколько файлов с именем xaa, xab, xac и т.д., зависит от того, как вы его разделяете. Теперь, чтобы "импортировать" каждый список в этот файл в команду rm, используйте это:

rm $(<xaa)
rm $(<xab)
rm $(<xac)

Извините за мой плохой английский.

user219776 28 нояб. 2013, в 03:07

5

Если у вас есть файл с именем pdf_format_sucks.docx он также будет удален ... ;-) Вы должны использовать правильное и точное регулярное выражение при подборе файлов pdf.
FooF 28 нояб. 2013, в 03:09
0

Ах, это правда. Извини, мой плохой: D. Я пытаюсь редактировать это.
user219776 29 окт. 2016, в 09:29
1

Лучше, но все still_pdf_format_sucks.docx будет удален. Точка . в ".pdf" регулярное выражение соответствует любому символу. Я бы предложил "[.]pdf$" вместо .pdf .
FooF 12 нояб. 2016, в 08:56

Показать ещё 1 комментарий

1

И еще один:

cd  /path/to/pdf
printf "%s\0" *.[Pp][Dd][Ff] | xargs -0 rm

lind 03 июль 2012, в 00:16

1

Хотя этот фрагмент кода может решить вопрос, в том числе объяснение того, как и почему это решает проблему , действительно поможет улучшить качество вашего сообщения. Помните, что вы отвечаете на вопрос для читателей в будущем, а не только для того, кто спрашивает сейчас! Пожалуйста, отредактируйте свой ответ, чтобы добавить объяснение и указать, какие ограничения и предположения применяются.
Toby Speight 05 дек. 2016, в 16:07
0

В частности, если printf не является встроенной оболочкой, на него распространяются те же ограничения.
Toby Speight 18 июнь 2018, в 10:29

0

Использование GNU parallel (sudo apt install parallel) очень просто

Он выполняет команды многопоточности, где '{}' - это аргумент, переданный

например.

ls /tmp/myfiles* | parallel 'rm {}'

Jonathan Leaders 24 авг. 2017, в 22:45

0

Почему отрицательный голос?
Jonathan 02 янв. 2018, в 21:53
0

Я не знаю, но я предполагаю, что это потому, что передача вывода ls напрямую другим командам является опасным антипаттерном, и тот факт, что расширение подстановочного знака вызовет тот же сбой при выполнении ls как и в оригинальная команда rm .
Toby Speight 18 июнь 2018, в 10:35

0

Если у вас есть похожие проблемы с grep, самым простым решением является переход на один каталог обратно и выполнение рекурсивного поиска.

Итак, вместо

grep "something" *

вы можете использовать:

cd ..
grep "something" -R search_in_this_dir/

Обратите внимание, что он также будет рекурсивно искать подпапки в каталоге "search_in_this_dir".

Konrad Gałęzowski 14 апр. 2016, в 11:14

-2

Более безопасная версия, чем использование xargs, также не рекурсивная: ls -p | grep -v '/$' | grep '\.pdf$' | while read file; do rm "$file"; done

Фильтрация наших каталогов здесь немного не нужна, так как "rm" в любом случае не удалит ее, и ее можно удалить для простоты, но зачем запускать что-то, что обязательно вернет ошибку?

Kaplan Ilya 11 май 2016, в 09:48

3

Это вовсе не безопасно и не работает с именами файлов с символами новой строки в них, чтобы указать на один очевидный угловой случай. Парсинг ls является распространенным антипаттерном, которого определенно следует избегать, и добавляет сюда ряд дополнительных ошибок. grep | grep просто не очень элегантный.
tripleee 11 май 2016, в 12:56
0

В любом случае, это не новая и экзотическая проблема, требующая комплексного решения. Ответы с find хороши и хорошо документированы здесь и в других местах. См., Например, mywiki.wooledge.org, чтобы узнать больше об этой и смежных темах.
tripleee 11 май 2016, в 13:02

-2

У меня была та же проблема с папкой, полной временных изображений, которые росли день ото дня, и эта команда помогла мне очистить папку

find . -name "*.png" -mtime +50 -exec rm {} \;

Разница с другими командами - это параметр mtime, который будет принимать только файлы старше X дней (в примере 50 дней)

Используя это несколько раз, уменьшая при каждом выполнении дневной диапазон, я смог удалить все ненужные файлы

Brugolo 23 март 2016, в 12:00

-2

Предположим, что введено имя входного каталога и выведено имя выходного каталога. Затем вы можете использовать простой цикл для копирования всех

for f in input/*
do
cp $f output
done

HMS 20 янв. 2016, в 08:01

-4

Этот параметр кажется простым для этой проблемы. Я получил эту информацию из какой-то другой темы, но это помогло мне.

for file in /usr/op/data/Software/temp/application/openpages-storage/*; do
    cp "$file" /opt/sw/op-storage/
done

Просто запустите указанную выше команду, и она выполнит задачу.

Amittal 01 фев. 2017, в 00:23

Ещё вопросы

Вы можете найти эту ссылку полезной
related: Решение «mv: список аргументов слишком длинный»?
Также это может быть актуально http://mywiki.wooledge.org/BashFAQ/095
Stack Overflow - сайт для вопросов программирования и разработки. Этот вопрос, кажется, не по теме, потому что он не о программировании или разработке. Смотрите, какие темы я могу задать здесь, в Справочном центре. Возможно, лучше спросить Super User или Unix & Linux Stack Exchange .
@jww: И я продолжал думать, что bash подпадает под «программные инструменты, обычно используемые программистами» - категорию, вопросы которой можно задавать здесь!
@Nik - Добавление "... в сценарии" не является убедительным. Когда проблема сводится к примеру Minimal, Complete и Verifiable , это просто вопрос о том, как выполнить команду. Мои извинения, если я что-то упускаю очевидное.
@jww: не "как запустить команду" ... а "как запустить эту конкретную команду без получения ошибки, которую я получаю" ... нет?
Отличный ответ, так нужно отвечать на все вопросы. Спасибо!
+1 за упоминание цикла for . Раньше я использовал find , но я всегда смотрю, как это сделать, так как я постоянно забываю опции и т. Д. for кажется легче вспомнить ИМХО
Использовал его как for f in *; do rm "$f"; done работу как очарование
Решение for цикла фактически спасло меня!
Решение find -exec кажется НАМНОГО быстрее, чем цикл for .
цикл for мучительно медленный. попробовал это на директории с более чем 100 000 файлами, а через 30 секунд он удалил только 12 000 или около того. Пробовал find версию и это было сделано за полсекунды
Пять лет спустя на 4.15.0 ( 4.15.0-1019-gcp ), и предел все еще на 2097152. Интересно, что поиск ARG_MAX в 4.15.0-1019-gcp linux дает результат, показывающий, что ARG_MAX на 131702.
Решение для цикла for намного медленнее, чем решение find.
Это все равно вернет «Список аргументов слишком длинный». По крайней мере, для меня это так. Использование xargs , согласно ответу Денниса, работает как задумано.
Это работало для меня, в отличие от xargs …: o
У @Sergio была та же самая проблема, это было вызвано отсутствующими кавычками вокруг образца имени.
аааа, почему инструмент для поиска вещей даже имеет переключатель для удаления? неужели только я считаю ненужным, мягко говоря, и опасным.
@mathreadler Рассматривает тот факт, что распространенным вариантом использования -exec является удаление группы файлов. -exec rm {} + будет делать то же самое, но все равно требует запуска хотя бы одного внешнего процесса. -delete позволяет find просто выполнять необходимые системные вызовы самостоятельно, без использования внешней оболочки.
Для удаления команды в Linux, которая может быть катастрофой, если вы инженер и ввели ошибку, я считаю, что это «самый безопасный и я знаю, что происходит», это лучший вариант. Не то, что если вы пропустите ввод точки, ваша компания потерпит крах за одну минуту.
Как мы можем сделать это расширением по умолчанию для определенных команд? Существует множество «стандартных» команд linux, в которых известно, нужны ли они всем сразу или нет (например, «rm»)
Обратите внимание, что это работает только тогда, когда echo является встроенной оболочкой. Если вы в конечном итоге используете команду echo , вы все равно столкнетесь с ограничением аргументов программы.
Это также удаляет файлы из подкаталогов. Как это предотвратить?
@NikunjChauhan Добавить опцию -maxdepth: find . -maxdepth 1 -name '*.pdf' -exec rm -f {} \;
Эта опция может быть опцией только для Linux, как указано выше в ответе @ Dennis (выбранный ответ).
Для большого количества файлов это кажется значительно быстрее
Я думаю, что это будет действительно хорошо с файлом с именем, например, -rf .. .pdf
да, но, как правило, при использовании в оболочке издатель команды «должен» посмотреть, что он делает :). На самом деле я предпочитаю перенаправить в файл, а затем проверять каждую строку.
Это не цитата "$ f". Это то, о чем говорил ThiefMaster. -rf имеет приоритет над -i , так что ваша вторая версия не лучше (без проверки вручную). И в принципе бесполезно для массового удаления, потому что подсказки для каждого файла.
Хотя этот фрагмент кода может решить вопрос, в том числе объяснение того, как и почему это решает проблему , действительно поможет улучшить качество вашего сообщения. Помните, что вы отвечаете на вопрос для читателей в будущем, а не только для того, кто спрашивает сейчас! Пожалуйста, отредактируйте свой ответ, чтобы добавить объяснение и указать, какие ограничения и предположения применяются.
Нет, rm не имеет такого ограничения на количество файлов, которые он будет обрабатывать (кроме того, его argc не может быть больше, чем INT_MAX ). Это ограничение ядра на максимальный размер всего массива аргументов (поэтому длина имен файлов значительна).
Я не знаю, почему кто-то отрицал это, даже не комментируя это (это политика, ребята!). Мне нужно было удалить все файлы внутри папки (вопрос не к PDF-файлам, обратите внимание), и для этого этот трюк работает хорошо, в конце концов все, что нужно сделать, это воссоздать папку, которая была удалена, когда Я использовал `rm -R / path / to / folder".
Это работает, потому что в случае с OP он использовал *, который расширился до огромного списка .pdf, давая каталог, который будет обрабатывать это внутренне, таким образом, не имея дело с проблемой OP. Я думаю, что по этой причине было отклонено. Он может быть недоступен для OP, если у него есть вложенный каталог или другие файлы (не pdf) в его каталоге
Если у вас есть файл с именем pdf_format_sucks.docx он также будет удален ... ;-) Вы должны использовать правильное и точное регулярное выражение при подборе файлов pdf.
Ах, это правда. Извини, мой плохой: D. Я пытаюсь редактировать это.
Лучше, но все still_pdf_format_sucks.docx будет удален. Точка . в ".pdf" регулярное выражение соответствует любому символу. Я бы предложил "[.]pdf$" вместо .pdf .
Хотя этот фрагмент кода может решить вопрос, в том числе объяснение того, как и почему это решает проблему , действительно поможет улучшить качество вашего сообщения. Помните, что вы отвечаете на вопрос для читателей в будущем, а не только для того, кто спрашивает сейчас! Пожалуйста, отредактируйте свой ответ, чтобы добавить объяснение и указать, какие ограничения и предположения применяются.
В частности, если printf не является встроенной оболочкой, на него распространяются те же ограничения.
Я не знаю, но я предполагаю, что это потому, что передача вывода ls напрямую другим командам является опасным антипаттерном, и тот факт, что расширение подстановочного знака вызовет тот же сбой при выполнении ls как и в оригинальная команда rm .
Это вовсе не безопасно и не работает с именами файлов с символами новой строки в них, чтобы указать на один очевидный угловой случай. Парсинг ls является распространенным антипаттерном, которого определенно следует избегать, и добавляет сюда ряд дополнительных ошибок. grep | grep просто не очень элегантный.
В любом случае, это не новая и экзотическая проблема, требующая комплексного решения. Ответы с find хороши и хорошо документированы здесь и в других местах. См., Например, mywiki.wooledge.org, чтобы узнать больше об этой и смежных темах.

DPlusV · Accepted Answer · 2012-07-02T08-15-00.000Z

497

Лучший ответ

Причина этого в том, что bash фактически расширяет звездочку для каждого соответствующего файла, создавая очень длинную командную строку.

Попробуйте следующее:

find . -name "*.pdf" -print0 | xargs -0 rm

Предупреждение:. Это рекурсивный поиск и поиск (и удаление) файлов в подкаталогах. Tack on -f в команду rm, только если вы уверены, что не хотите подтверждения.

Если вы работаете в Linux, вы можете сделать следующее, чтобы сделать команду нерекурсивной:

find . -maxdepth 1 -name "*.pdf" -print0 | xargs -0 rm

Другой вариант - использовать флаг -delete:

find . -name "*.pdf" -delete

DPlusV 02 июль 2012, в 08:15

1

Разве это не отправляет точно такие же аргументы в rm, как в rm -f * .pdf? (Или, если есть подкаталоги, еще больше аргументов.)
Thomas Padron-McCarthy 02 июль 2012, в 07:48
6

Нет, xargs специально разбивает список и при необходимости выдает несколько команд.
tripleee 02 июль 2012, в 07:50
0

обратите внимание, что этот и другой ответ «найти» удалит файлы PDF из подкаталогов, что отличается от поведения «rm * .pdf», хотя неясно, за каким именно поведением следует спрашивающий.
Bobby Jack 02 июль 2012, в 07:55
0

Действительно, это рекурсивный поиск, который отличается от исходного вопроса. Я добавил предупреждение - спасибо за указание на это несоответствие.
DPlusV 02 июль 2012, в 07:56
0

@ Денис: Что, если я заменю. с точным путем к каталогу - удалит ли он pdf из всех подкаталогов?
Vicky 02 июль 2012, в 08:07
0

@BobbyJack: Я хочу удалить PDF только из текущего рабочего каталога. Не из всех подкаталогов. Как вышеуказанное решение будет изменено для этого случая?
Vicky 02 июль 2012, в 08:08
0

@Dennis: Также не могли бы вы привести примеры команд CP и MV, использующих ваше решение? Где дать каталог назначения?
Vicky 02 июль 2012, в 08:11
0

@NikunjChauhan Я обновил команду find для работы только в текущем каталоге (см. -maxdepth -1 ). Для cp и mv я бы использовал альтернативный синтаксис: find . -name "*.pdf" -maxdepth 1 -exec cp {} FOO - FOO - это пункт назначения. Команда будет каждый раз повторять команду cp, заменяя {} именем файла. М.В. будет работать аналогично.
DPlusV 02 июль 2012, в 08:14
6

@Dennis: -maxdepth 1 должен быть первым аргументом после пути.
Barton Chittenden 02 июль 2012, в 12:12
0

из канала #bash: «xargs (1) опасен (не работает, может использоваться и т. д.) при чтении ввода, не разделенного NUL. Если вы работаете с именами файлов, используйте find's -exec [command] {} + вместо или -print0 | xargs -0 при условии, что вы не заботитесь о переносимости и не хотите делать лишнюю дополнительную работу. В противном случае это хорошо for цикла. "
Édouard Lopez 05 сен. 2013, в 23:38
0

правильно (er): найти. -maxdepth 1 -имя "* .pdf" -print0 | XARGS -0 RM
user85155 06 май 2014, в 07:08
37

Find имеет флаг -delete для удаления найденных файлов, и даже если этого не произойдет, все равно будет лучше использовать -exec для выполнения rm, а не вызывать xargs (теперь это 3 процесса и канал вместо один процесс с -delete или 2 процесса с -exec ).
scragar 20 май 2014, в 10:10
3

@ ÉdouardLopez ... Но это чтение ввода, разделенного NULL. И все dangerous (broken, exploitable, etc.) Довольно нелепо. Несомненно, вы должны быть осторожны при использовании xargs , но это не совсем eval/evil .
BroSlow 25 июль 2014, в 22:37
0

Что делать, если мне нужно удалить файлы в режиме sudo? Когда я запускаю этот код, я получаю список файлов с надписью «Отказано в доступе»
nukeguy 02 фев. 2015, в 21:47
0

в Centos / bash это выдает ту же ошибку - список аргументов слишком длинный.
Code Abominator 24 апр. 2015, в 03:12
0

Смешной. Когда это случилось со мной (потому что у меня был каталог с более чем 100 000 пустых файлов), я просто рефлекторно изменил его на причудливый цикл. c=1;l=$(ls | wc -l); for i in *; do rm $i; echo "[$c / $l] $i"; c=$((c + 1)); done
Braden Best 27 нояб. 2015, в 00:07
4

@scragar С -exec вызывающим rm , число процессов будет равно 1 + количество файлов, хотя число одновременных процессов из этого может быть 2 (возможно, команда find выполнит процессы rm одновременно). Число процессов, использующих xargs будет резко сокращено до 2 + n, где n - это некоторое число процессов, которое меньше числа файлов (скажем, число файлов / 10, хотя, вероятно, больше в зависимости от длины путей). Предполагая, что find выполняет удаление напрямую, использование -delete должно быть единственным процессом, который будет вызван.
neuralmer 06 июль 2016, в 14:02
0

find . -maxdepth 1 -delete работал для меня
David d C e Freitas 26 июнь 2017, в 09:48
1

В системе Debian с файловой системой ext3 найти было НЕТ решения для меня. Решение for loop, представленное Эдуардом Лопесом, легко, безопасно, хорошо объяснено и работает на моей системе.
Freitags 06 июль 2017, в 07:53
0

Также нашел это решение неэффективным. Смотрите варианты петли
mmann1123 25 июль 2017, в 00:26
0

Последний работает как шарм. Потрясающие
Faris Rayhan 05 нояб. 2017, в 13:00
0

@scragar Использование команды find's -exec не всегда лучше, особенно в подобных случаях («Список аргументов слишком длинный»). Хотя это правда, что использование -exec приводит к 2 подпроцессам и отсутствию канала (что, конечно, звучит намного лучше, чем 3 процесса и канал), это максимум. параллельные процессы, что сильно отличается от общего числа процессов, запущенных для выполнения задания, как отмечает @neuralmer. С точки зрения скорости, -delete > xargs> -exec , потому что разумные реализации xargs разбивают аргументы на пакеты, чтобы уменьшить подпроцесс, тогда как -exec == 1 аргумент на процесс.
Mark G. 05 март 2019, в 04:22
0

… Тем не менее, я понимаю, что слепое доверие к xargs не обходится без невероятно болезненных ошибок (особенно когда речь идет о rm ), поэтому, если вы придете к этому с точки зрения безопасности, а не с точки зрения скорости, я всегда с вами ,
Mark G. 05 март 2019, в 04:24
0

Отличное решение, но есть ли способ показать прогресс удаления?
Dr_Zaszuś 06 март 2019, в 13:10

Показать ещё 22 комментария