s3cmd слишком много раз терпел неудачу

Question

s3cmd слишком много раз терпел неудачу

46

Раньше я был счастливым пользователем s3cmd. Однако недавно, когда я пытаюсь передать большой zip файл (~ 7Gig) в Amazon S3, я получаю эту ошибку:

$> s3cmd put thefile.tgz s3://thebucket/thefile.tgz

....
  20480 of 7563176329     0% in    1s    14.97 kB/s  failed
WARNING: Upload failed: /thefile.tgz ([Errno 32] Broken pipe)
WARNING: Retrying on lower speed (throttle=1.25)
WARNING: Waiting 15 sec...
thefile.tgz -> s3://thebucket/thefile.tgz  [1 of 1]
       8192 of 7563176329     0% in    1s     5.57 kB/s  failed
ERROR: Upload of 'thefile.tgz' failed too many times. Skipping that file.

Я использую последний s3cmd на Ubuntu.

Почему так? и как я могу его решить? Если это неразрешимо, какой альтернативный инструмент я могу использовать?

qliq 25 апр. 2011, в 02:06

Источник

1

Помните, что если это произойдет, s3cmd <= 1.5.0 также может вернуть 0 из s3cmd put в код возврата (возможно, даже в последних версиях). Никогда не доверяйте s3cmd для критических операций.
Antti Haapala 30 апр. 2015, в 12:20
2

@AnttiHaapala Какую альтернативу вы бы порекомендовали вместо s3cmd?
Henley Chiu 23 март 2016, в 20:24

Теги:

ubuntu

amazon-s3

file-upload

backup

15 ответов

53

И теперь, в 2014 году, aws cli имеет возможность загружать большие файлы вместо s3cmd.

http://docs.aws.amazon.com/cli/latest/userguide/cli-chap-getting-set-up.html имеет инструкции по установке/настройке или часто:

$ wget https://s3.amazonaws.com/aws-cli/awscli-bundle.zip
$ unzip awscli-bundle.zip
$ sudo ./awscli-bundle/install -i /usr/local/aws -b /usr/local/bin/aws
$ aws configure

за которым следует

$ aws s3 cp local_file.tgz s3://thereoncewasans3bucket

даст вам удовлетворительные результаты.

user116293 01 март 2014, в 00:07

0

+1! У меня есть файл на 110 ГБ, который мне нужно было сделать на постоянной основе, делать это по частям ужасно. Вышеуказанное решение великолепно!
Geesu 17 сен. 2014, в 15:18
0

Я просто потратил около часа в чате с поддержкой AWS, и они на самом деле рассказали мне эту ТАКУЮ статью! Несмотря на то, что мои файлы были <100Mb, и эта ошибка просто возникла из ниоткуда ... Установка CLI AWS и переключение на эту проблему решило проблему.
Dave Collins 05 апр. 2015, в 04:56

29

Я сам столкнулся с этой проблемой. У меня есть файл 24g.tar.gz для размещения в S3.

Загрузка меньших частей поможет.

Также существует ограничение размера файла ~ 5 ГБ, поэтому я разбиваю файл на куски, который можно повторно собрать, когда фрагменты будут загружены позже.

split -b100m ../input-24GB-file.tar.gz input-24GB-file.tar.gz-

Последняя часть этой строки является "префиксом". Split добавит "aa", "ab", "ac" и т.д. К нему. -b100m означает 100 МБ кусков. 24-гигабайтный файл будет содержать около 240 частей 100mb, называемых "input-24GB-file.tar.gz-aa" для "input-24GB-file.tar.gz-jf".

Чтобы объединить их позже, загрузите их все в каталог и:

cat input-24GB-file.tar.gz-* > input-24GB-file.tar.gz

Принимая md5sums исходного и разделенного файлов и сохраняя это в ведре S3, или, лучше, если он не такой большой, используя такую систему, как parchive, чтобы иметь возможность проверить, даже исправить некоторые проблемы с загрузкой также могут быть полезными.

Alister Bulman 28 апр. 2011, в 11:38

1

Спасибо Алистер. Я не знал о пределе размера файла ~ 5Gig. Так что нет проблем с s3cmd :)
qliq 29 апр. 2011, в 02:32
4

Я полагаю, что это ограничение s3cmd, так как Amazon имеет файлы размером несколько терабайт.
philfreo 06 май 2011, в 01:45
0

Файл такой большой может быть одной из причин. Но у меня возникла проблема с файлами размером до 100 МБ.
qliq 09 нояб. 2011, в 04:32
0

Это все о сети. На AWS обычно меньше проблем, но за пределами локальной сети все ставки отключены. Вы можете разделить файлы еще меньше.
Alister Bulman 09 нояб. 2011, в 16:22
0

Сплит-B5G работал для меня. Пробовал -b10G но не получилось. 5Гига тогда.
Xavi Montero 10 янв. 2013, в 10:05
4

На данный момент S3 принимает файлы размером до 5 ТБ, но может принимать только отдельные загрузки до 5 ГБ. Больше требует загрузки нескольких частей. aws.amazon.com/s3/faqs/#How_much_data_can_I_store
Leopd 30 авг. 2013, в 14:49

Показать ещё 4 комментария

14

Я пробовал все остальные ответы, но никто не работал. Похоже, s3cmd довольно чувствителен. В моем случае ведро s3 находилось в ЕС. Маленькие файлы будут загружаться, но когда он дошел до ~ 60k, он всегда терпел неудачу.

Когда я изменил файл ~/.s3cfg, он сработал.

Вот изменения, которые я сделал:

host_base = s3-eu-west-1.amazonaws.com

host_bucket =% (ведро) s.s3-eu-west-1.amazonaws.com

Ger Hartnett 06 нояб. 2013, в 00:34

0

Благодарю. Это спасло мне жизнь сегодня
Slawek Rewaj 06 авг. 2014, в 10:44
0

Добро пожаловать Salwek, спасибо, что сообщили мне знать.
Ger Hartnett 25 авг. 2014, в 14:23
0

помог мне тоже спасибо
ghostika 12 дек. 2014, в 15:32
0

Потрясающие. Ты тоже спас мой день.
aherve 29 дек. 2014, в 12:54
0

Вы спасли мой день! Спасибо!
Mike 20 янв. 2015, в 09:37
0

bucket_location = eu-west-1
dwery 08 сен. 2015, в 17:07

Показать ещё 4 комментария

10

У меня была такая же проблема с ubuntu s3cmd.

s3cmd --guess-mime-type --acl-public put test.zip s3://www.jaumebarcelo.info/teaching/lxs/test.zip
test.zip -> s3://www.jaumebarcelo.info/teaching/lxs/test.zip  [1 of 1]
 13037568 of 14456364    90% in  730s    17.44 kB/s  failed
WARNING: Upload failed: /teaching/lxs/test.zip (timed out)
WARNING: Retrying on lower speed (throttle=0.00)
WARNING: Waiting 3 sec...
test.zip -> s3://www.jaumebarcelo.info/teaching/lxs/test.zip  [1 of 1]
  2916352 of 14456364    20% in  182s    15.64 kB/s  failed
WARNING: Upload failed: /teaching/lxs/test.zip (timed out)
WARNING: Retrying on lower speed (throttle=0.01)
WARNING: Waiting 6 sec...

Решением было обновление s3cmd с помощью инструкций из s3tools.org:

Debian и Ubuntu

Наш репозиторий DEB был тщательно создан в наиболее совместимых путь - он должен работать для Debian 5 (Lenny), Debian 6 (Squeeze), Ubuntu 10.04 LTS (Lucid Lynx) и для всех более новых и, возможно, для некоторых более старых выпусков Ubuntu. Выполните следующие шаги из командной строки:

Импорт ключа подписи S3tools:

wget -O- -q http://s3tools.org/repo/deb-all/stable/s3tools.key | sudo apt-key add -

Добавьте repo в sources.list:

sudo wget -O/etc/apt/sources.list.d/s3tools.list http://s3tools.org/repo/deb-all/stable/s3tools.list

Обновите кеш кеша и установите новейший s3cmd:

sudo apt-get update && sudo apt-get install s3cmd

Jaume Barcelo 27 июнь 2012, в 11:42

2

скопируйте содержимое ссылки сюда, оставьте ссылку как ссылку.
Inbar Rose 21 окт. 2012, в 08:50
0

Я пытался обновить с оригинальной страницы инструкции, но все равно с файлом 24GB не удается, в то время как файл 1GB работает. Пробую другие решения.
Xavi Montero 10 янв. 2013, в 07:35
0

Если это не работает, установите из пакетов tar. sourceforge.net/projects/s3tools/files/s3cmd/1.1.0-beta2/...
Elmer 22 апр. 2013, в 03:26
1

На самом деле, это не сработало для меня. Он обновился до 1.0.x, но имел ту же проблему. Как предложил @ user1681360, сборка tarball (v 1.5.x) устранила проблему (она загружалась с использованием нескольких частей).
DavidJ 02 май 2013, в 20:55
0

У меня была проблема при загрузке файла размером 38 МБ, потому что я использовал экземпляр t1.micro с ограниченной пропускной способностью - переход на экземпляр m1-medium решил эту проблему.
devstopfix 07 апр. 2014, в 10:22
0

да, multiart работал.
Brett 26 май 2015, в 09:43

Показать ещё 4 комментария

6

Эта ошибка возникает, когда Amazon возвращает ошибку: они, похоже, отключают сокет, чтобы вы не загружали гигабайты запроса, чтобы получить ответ "нет, это не удалось" в ответ. Вот почему некоторые люди получают это из-за перекоса часов, некоторые люди получают его из-за ошибок политики, а другие сталкиваются с ограничениями по размеру, требующим использования API загрузки с несколькими частями. Дело не в том, что все ошибаются или даже смотрят на разные проблемы: это все разные симптомы одного и того же основного поведения в s3cmd.

Поскольку большинство условий ошибки будут детерминированными, поведение s3cmd отбрасывания сообщения об ошибке и медленного повторения выглядит сумасшедшим неудачным:(.then. Чтобы получить фактическое сообщение об ошибке, вы можете перейти в /usr/share/s 3cmd/S3/S3.py(помня, что нужно удалить соответствующий .pyc, чтобы изменения были использованы) и добавить print e в блок send_file except Exception, e:.

В моем случае я пытался установить Content-Type загруженного файла в "application/x-debian-package". По-видимому, s3cmd S3.object_put 1) не соблюдает Content-Type, переданный через --add-header, но 2) не может перезаписать Content-Type, добавленный через --add-header, поскольку он хранит заголовки в словаре с case- чувствительных клавиш. Результатом является то, что он выполняет подсчет подписи с использованием значения "тип контента" и затем заканчивается (по крайней мере, с множеством запросов, это может быть основано на каком-то порядке хэширования), отправляя "Content-Type" в Amazon, что приводит к ошибке подписи.

В моем конкретном случае сегодня кажется, что -M приведет к тому, что s3cmd угадает правильный Content-Type, но, похоже, это делается на основе имени файла... Я бы надеялся, что он будет использовать базу данных на основе mimemagic на содержимое файла. Честно говоря, s3cmd даже не может вернуть статус выхода из строя, когда он не может загрузить файл, поэтому в сочетании со всеми этими другими проблемами, вероятно, лучше просто написать собственный одноразовый инструмент, чтобы сделать один вещь, в которой вы нуждаетесь... почти наверняка, что в конечном итоге это сэкономит вам время, когда вас укусит какой-нибудь угловой случай этого инструмента: (.

Jay Freeman -saurik- 19 июль 2013, в 14:56

0

Спасибо, что дали понять, что s3cmd не так хорош, как его популярность заставила меня поверить. Используя aws s3 cp сейчас.
tobltobs 22 янв. 2016, в 17:21

5

s3cmd 1.0.0 еще не поддерживает многопоточность. Я пробовал 1.1.0-бета, и все работает отлично. Вы можете прочитать о новых функциях здесь: http://s3tools.org/s3cmd-110b2-released

Jirapong 11 сен. 2012, в 09:12

1

Хотелось бы, чтобы я высказался об этом больше: это самое простое решение проблемы, описанной Алистером Булманом (а не проблемы, описанные Жауме Барсело, qliq или другими). s3cmd-1.1.0-betaX ( beta3 на момент написания статьи) не только выполняет разбиение и загрузку, но и просит Amazon повторно объединить файлы, чтобы они отображались в S3 как один файл. ЭТО ВАЖНО, если вы собираетесь использовать его в Elastic Map-Reduce, где у вас нет возможности рекомбинировать их вручную с помощью cat .
Jim Pivarski 04 дек. 2013, в 19:57

4

У меня возникла такая же проблема, она оказалась плохим значением bucket_location в ~/.s3cfg.

Это сообщение в блоге привело меня к ответу.

Если bucket youre uploading to does not exist (или вы пропустили его набрав), itll завершится с ошибкой. Спасибо, общее сообщение об ошибке. - См. Больше на: http://jeremyshapiro.com/blog/2011/02/errno-32-broken-pipe-in-s3cmd/#sthash.ZbGwj5Ex.dpuf

После проверки моего ~/.s3cfg видно, что у него было:

bucket_location = Sydney

Вместо

bucket_location = ap-southeast-2

Исправление этого значения для использования надлежащего имени (ов) решило проблему.

Nick Breen 01 апр. 2016, в 22:49

0

То же самое здесь - пришлось изменить bucket_location = EU на bucket_location = eu-west-1
jkukul 22 дек. 2016, в 11:20

2

Для меня работало:

В .s3cfg, я изменил host_bucket

host_bucket = %(bucket)s.s3-external-3.amazonaws.com

user3237783 26 янв. 2014, в 15:58

0

Спасибо, у меня тоже сработало.
bjesus 03 нояб. 2014, в 12:32
0

Эта проблема была связана не с корзиной, а с ее распространением в DNS.
Mich. Gio. 30 май 2016, в 08:53

1

s3cmd версия 1.1.0-beta3 или выше автоматически будет использовать multipart uploads, чтобы разрешить отправку произвольно больших файлов (источник). Вы также можете контролировать размер куска, который он использует. например.

s3cmd --multipart-chunk-size-mb=1000 put hugefile.tar.gz s3://mybucket/dir/

Это сделает загрузку в 1 ГБ фрагментов.

overthink 26 нояб. 2014, в 19:30

0

Найдите .s3cfg файл, как правило, в вашей домашней папке.

Если у вас есть это, вы получите злодея. Изменение двух следующих параметров должно помочь вам.

socket_timeout = 1000
multipart_chunk_size_mb = 15

Kaey 05 окт. 2016, в 07:19

0

Я столкнулся с аналогичной ошибкой, которая в конечном итоге оказалась вызвана временным дрейфом на машине. Правильно установите время для исправления проблемы.

yoniLavi 13 янв. 2014, в 18:15

0

В моем случае я исправил это, просто добавив права.

Bucket > Properties > Permissions 
"Authenticated Users"
- List
- Upload/Delete
- Edit Permissions

Ignacio Pascual 17 авг. 2013, в 16:06

0

Я столкнулся с той же ошибкой, что и ошибка группы безопасности, так как политика безопасности была установлена неправильно. Я обвиняю документацию S3.

Я писал о как правильно настроить политику в своем блоге, который:

{
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "s3:ListBucket",
        "s3:GetBucketLocation",
        "s3:ListBucketMultipartUploads"
      ],
      "Resource": "arn:aws:s3:::example_bucket",
      "Condition": {}
    },
    {
      "Effect": "Allow",
      "Action": [
        "s3:AbortMultipartUpload",
        "s3:DeleteObject",
        "s3:DeleteObjectVersion",
        "s3:GetObject",
        "s3:GetObjectAcl",
        "s3:GetObjectVersion",
        "s3:GetObjectVersionAcl",
        "s3:PutObject",
        "s3:PutObjectAcl",
        "s3:PutObjectAclVersion"
      ],
      "Resource": "arn:aws:s3:::example_bucket/*",
      "Condition": {}
    }
  ]
}

samwize 21 апр. 2013, в 06:46

-1

Я обратился к этому просто не используя s3cmd. Вместо этого у меня был большой успех с проектом python, S3-Multipart на GitHub. Он загружает и загружает, а также использует столько потоков, сколько требуется.

Dolan Antenucci 08 нояб. 2012, в 22:57

0

Не уверен, почему я получил отрицательное голосование - действительно продуктивно, чтобы не комментировать - но я отмечу, что я прекратил использовать этот проект, который, возможно, однажды дал мне некоторые поврежденные данные, и я просто использую исключительно CLI AWS.
Dolan Antenucci 29 апр. 2016, в 12:42

Ещё вопросы

Помните, что если это произойдет, s3cmd <= 1.5.0 также может вернуть 0 из s3cmd put в код возврата (возможно, даже в последних версиях). Никогда не доверяйте s3cmd для критических операций.
@AnttiHaapala Какую альтернативу вы бы порекомендовали вместо s3cmd?
+1! У меня есть файл на 110 ГБ, который мне нужно было сделать на постоянной основе, делать это по частям ужасно. Вышеуказанное решение великолепно!
Я просто потратил около часа в чате с поддержкой AWS, и они на самом деле рассказали мне эту ТАКУЮ статью! Несмотря на то, что мои файлы были <100Mb, и эта ошибка просто возникла из ниоткуда ... Установка CLI AWS и переключение на эту проблему решило проблему.
Спасибо Алистер. Я не знал о пределе размера файла ~ 5Gig. Так что нет проблем с s3cmd :)
Я полагаю, что это ограничение s3cmd, так как Amazon имеет файлы размером несколько терабайт.
Файл такой большой может быть одной из причин. Но у меня возникла проблема с файлами размером до 100 МБ.
Это все о сети. На AWS обычно меньше проблем, но за пределами локальной сети все ставки отключены. Вы можете разделить файлы еще меньше.
Сплит-B5G работал для меня. Пробовал -b10G но не получилось. 5Гига тогда.
На данный момент S3 принимает файлы размером до 5 ТБ, но может принимать только отдельные загрузки до 5 ГБ. Больше требует загрузки нескольких частей. aws.amazon.com/s3/faqs/#How_much_data_can_I_store
Благодарю. Это спасло мне жизнь сегодня
Добро пожаловать Salwek, спасибо, что сообщили мне знать.
Потрясающие. Ты тоже спас мой день.
скопируйте содержимое ссылки сюда, оставьте ссылку как ссылку.
Я пытался обновить с оригинальной страницы инструкции, но все равно с файлом 24GB не удается, в то время как файл 1GB работает. Пробую другие решения.
Если это не работает, установите из пакетов tar. sourceforge.net/projects/s3tools/files/s3cmd/1.1.0-beta2/...
На самом деле, это не сработало для меня. Он обновился до 1.0.x, но имел ту же проблему. Как предложил @ user1681360, сборка tarball (v 1.5.x) устранила проблему (она загружалась с использованием нескольких частей).
У меня была проблема при загрузке файла размером 38 МБ, потому что я использовал экземпляр t1.micro с ограниченной пропускной способностью - переход на экземпляр m1-medium решил эту проблему.
Спасибо, что дали понять, что s3cmd не так хорош, как его популярность заставила меня поверить. Используя aws s3 cp сейчас.
Хотелось бы, чтобы я высказался об этом больше: это самое простое решение проблемы, описанной Алистером Булманом (а не проблемы, описанные Жауме Барсело, qliq или другими). s3cmd-1.1.0-betaX ( beta3 на момент написания статьи) не только выполняет разбиение и загрузку, но и просит Amazon повторно объединить файлы, чтобы они отображались в S3 как один файл. ЭТО ВАЖНО, если вы собираетесь использовать его в Elastic Map-Reduce, где у вас нет возможности рекомбинировать их вручную с помощью cat .
То же самое здесь - пришлось изменить bucket_location = EU на bucket_location = eu-west-1
Эта проблема была связана не с корзиной, а с ее распространением в DNS.
Не уверен, почему я получил отрицательное голосование - действительно продуктивно, чтобы не комментировать - но я отмечу, что я прекратил использовать этот проект, который, возможно, однажды дал мне некоторые поврежденные данные, и я просто использую исключительно CLI AWS.

qliq · Accepted Answer · 2011-12-06T21-32-00.000Z

В моем случае причиной отказа было время сервера, превышающее время S3. Поскольку я использовал GMT + 4 на своем сервере (расположенный на востоке США), и я использовал Amazon US East хранилище.

После настройки моего сервера на восточное время в США проблема исчезла.