Как урленкодировать данные для команды curl?

Question

Как урленкодировать данные для команды curl?

210

Я пытаюсь написать bash script для тестирования, который принимает параметр и отправляет его через curl на веб-сайт. Мне нужно, чтобы url закодировал значение, чтобы убедиться, что специальные символы обработаны должным образом. Каков наилучший способ сделать это?

Вот мой основной script:

#!/bin/bash
host=${1:?'bad host'}
value=$2
shift
shift
curl -v -d "param=${value}" http://${host}/somepath $@

Aaron 17 нояб. 2008, в 19:18

Источник

0

Смотрите также: Как декодировать строку в кодировке URL в оболочке? для не скручиваемых решений.
kenorb 01 март 2015, в 17:30
0

Смотрите также: Как я могу кодировать и декодировать строки в процентах в командной строке?
Anton Tarasenko 22 май 2018, в 19:17

Теги:

bash

curl

shell

scripting

urlencode

29 ответов

124

Вот чистый ответ BASH.

rawurlencode() {
  local string="${1}"
  local strlen=${#string}
  local encoded=""
  local pos c o

  for (( pos=0 ; pos<strlen ; pos++ )); do
     c=${string:$pos:1}
     case "$c" in
        [-_.~a-zA-Z0-9] ) o="${c}" ;;
        * )               printf -v o '%%%02x' "'$c"
     esac
     encoded+="${o}"
  done
  echo "${encoded}"    # You can either set a return variable (FASTER) 
  REPLY="${encoded}"   #+or echo the result (EASIER)... or both... :p
}

Вы можете использовать его двумя способами:

easier:  echo http://url/q?=$( rawurlencode "$args" )
faster:  rawurlencode "$args"; echo http://url/q?${REPLY}

[редактировать]

Здесь соответствующая функция rawurldecode(), которая - со всей скромностью - является удивительной.

# Returns a string in which the sequences with percent (%) signs followed by
# two hex digits have been replaced with literal characters.
rawurldecode() {

  # This is perhaps a risky gambit, but since all escape characters must be
  # encoded, we can replace %NN with \xNN and pass the lot to printf -b, which
  # will decode hex for us

  printf -v REPLY '%b' "${1//%/\\x}" # You can either set a return variable (FASTER)

  echo "${REPLY}"  #+or echo the result (EASIER)... or both... :p
}

С помощью набора соответствия теперь мы можем выполнить несколько простых тестов:

$ diff rawurlencode.inc.sh \
        <( rawurldecode "$( rawurlencode "$( cat rawurlencode.inc.sh )" )" ) \
        && echo Matched

Output: Matched

И если вы действительно чувствуете, что вам нужен внешний инструмент (ну, он будет идти намного быстрее и может делать двоичные файлы и т.д.). Я нашел это на своем маршрутизаторе OpenWRT...

replace_value=$(echo $replace_value | sed -f /usr/lib/ddns/url_escape.sed)

Где url_escape.sed был файл, содержащий эти правила:

# sed url escaping
s:%:%25:g
s: :%20:g
s:<:%3C:g
s:>:%3E:g
s:#:%23:g
s:{:%7B:g
s:}:%7D:g
s:|:%7C:g
s:\\:%5C:g
s:\^:%5E:g
s:~:%7E:g
s:\[:%5B:g
s:\]:%5D:g
s:`:%60:g
s:;:%3B:g
s:/:%2F:g
s:?:%3F:g
s^:^%3A^g
s:@:%40:g
s:=:%3D:g
s:&:%26:g
s:\$:%24:g
s:\!:%21:g
s:\*:%2A:g

Orwellophile 18 май 2012, в 23:58

0

Текущая версия не страдает от этой ошибки.
user123444555621 02 сен. 2012, в 22:32
0

+1 для bash-реализации rawurldecode, не знал, что printf сделал% x или -v
nhed 11 сен. 2012, в 17:37
0

@ Pumbaa80 извините, моя вина за то, что я все еще использую Backfire 10.03 r20728. Спасибо за редактирование, я думал, что на самом деле мне придется использовать свой мозг на секунду: p
Orwellophile 24 сен. 2012, в 13:02
0

@ Pumbaa80: только что проверил первые правки (rawurldecode), но все, что красный и зеленый, повредили мой мыслитель - но версия, которая сейчас работает, составляет 100%. так что, если я ранее написал что-то отличное от этого, у меня был высокий клей. спасибо, что поймали это :)
Orwellophile 28 сен. 2012, в 05:52
3

К сожалению, этот скрипт завершается ошибкой на некоторых символах, таких как 'é' и '½', выводя 'e% FFFFFFFFFFFFFFCC' и '% FFFFFFFFFFFFFFC2' соответственно (я полагаю, b / c цикла для каждого символа).
Matthematics 24 март 2014, в 17:13
0

@ Любна: Вы, должно быть, используете BASH 3.x, прекрасно работает в BASH 4. Я не знаю простого способа исправить это, например printf '%%% d' "'é"
Orwellophile 11 апр. 2014, в 15:19
0

@ Любна: извините, я пыталась найти быстрое решение для BASH 3, но не смогла. Боюсь, вам просто придется использовать более медленный метод из других источников на этой странице. Или отправьте новый вопрос с просьбой дать ответ для работы с BASH 3 :)
Orwellophile 25 апр. 2014, в 09:24
0

Он не работает для меня в Bash 4.3.11 (1). Строка Jogging «à l'Hèze» генерирует Jogging%20%abà%20l%27Hèze%bb который не может быть decodeURIComponent в JS decodeURIComponent :(
dmcontador 19 нояб. 2015, в 12:07
1

В этом первом блоке кода что означает последний параметр для printf? То есть, почему это двойная кавычка, одинарная кавычка, знак доллара, буква с, двойная кавычка? Одинаковая кавычка делает?
Colin Fraizer 19 май 2016, в 14:31
0

@dmcontador - это всего лишь скромный bash-скрипт, в котором нет концепции многобайтовых символов или юникода. Когда он видит символ, подобный \u0144 ( \u0144 ), он наивно выводит% 144, ╡ ( \u2561 ) будет выводиться как% 2561. Правильные необработанные ответы для них будут% C5% 84% 0A и% E2% 95% A1 соответственно.
Orwellophile 08 июнь 2016, в 09:49
0

@ColinFraizer одиночная кавычка служит для преобразования следующего символа в его числовое значение. ссылка pubs.opengroup.org/onlinepubs/9699919799/utilities/...
Sam 22 нояб. 2018, в 22:37

Показать ещё 9 комментариев

81

Используйте модуль Perl URI::Escape и uri_escape во второй строке вашего bash script:

...

value="$(perl -MURI::Escape -e 'print uri_escape($ARGV[0]);' "$2")"
...

Изменить: Исправить проблемы с цитированием, как предлагает Крис Джонсен в комментариях. Спасибо!

dubek 18 нояб. 2008, в 09:34

2

URI :: Escape может быть не установлен, проверьте мой ответ в этом случае.
blueyed 10 нояб. 2009, в 19:50
3

Это не сработает, если $ 2 содержит апостроф.
nes1983 01 янв. 2010, в 15:53
0

Я исправил это (используйте echo , pipe и <> ), и теперь он работает, даже когда $ 2 содержит апостроф или двойные кавычки. Спасибо!
dubek 03 янв. 2010, в 09:35
9

Вы также покончили с echo : value="$(perl -MURI::Escape -e 'print uri_escape($ARGV[0]);' "$2")"
Chris Johnsen 03 янв. 2010, в 10:31
1

Версия Криса Джонсена лучше. У меня было $ {True} в моем тестовом выражении, и использование этого через echo вызвало расширение переменной uri_escape / Perl.
mm2001 07 янв. 2010, в 16:35
0

@thecoshman, вы предлагаете увидеть ответ, написанный на vanilla bash, без каких-либо внешних утилит, например, bash4, perl, awk, cat, cut, xxd и т. д.? (см. другие ответы ниже). (Фактически) все, что вы напишите, будет зависеть от внешней / версии, так как vanilla bash не настолько мощен. Мог бы хорошо научиться жить с этим. Или, возможно, с помощью геркулесовых усилий вы могли бы достичь этого. Вы действительно хотите сделать это, а не писать что-то намного, намного проще в perl / python / awk / etc.?
John Wiersba 25 авг. 2014, в 22:35
0

@ jrw32982 возможно я плохо себя выразил. Такие вещи, как sed, awk, cat - это инструменты, на которые вы можете установить гарантию 99,999%, однако Perl может не всегда быть на вашей машине. Да, Perl - отличное решение, но не очень помогает в (не очень маловероятной) ситуации, в которой у вас нет / не может быть Perl (например, администраторы).
thecoshman 26 авг. 2014, в 07:53
0

@thecoshman Моя точка зрения заключалась в том, что даже сценарии, использующие только тот набор инструментов, который, как вы утверждаете, находятся в диапазоне 99,999%, будут подвержены различиям версий на разных компьютерах. Посмотрите комментарии bash4 и bash3 для ответа Орвеллофила. Итак, я не согласен, что это плохой ответ из-за использования Perl. Это просто ответ с предварительными требованиями, как и практически каждый ответ. FWIW, с установленным Perl в моем опыте + 99% + для Linux, Solaris, AIX, HP / UX. YMMV.
John Wiersba 26 авг. 2014, в 15:56
1

@ jrw32982 да, оглядываясь назад, есть другой язык, на котором можно выполнить эту задачу - это хорошо. Если бы я мог, я бы забрал свое пониженное голосование, но, увы, оно сейчас заблокировано.
thecoshman 26 авг. 2014, в 18:36

Показать ещё 7 комментариев

49

для полноты, многие решения, использующие sed или awk, переводят только специальный набор символов и, следовательно, довольно велики по размеру кода, а также не переводят другие специальные символы, которые должны быть закодированы.

безопасный способ urlencode состоял бы в том, чтобы просто кодировать каждый отдельный байт - даже те, которые были бы разрешены.

echo -ne 'some random\nbytes' | xxd -plain | tr -d '\n' | sed 's/\(..\)/%\1/g'

xxd заботится здесь о том, что вход обрабатывается как байты, а не символы.

изменить:

xxd поставляется с vim-common пакетом в Debian, и я был только в системе, где он не был установлен, и я не хотел его устанавливать. Алтернативным является использование hexdump из пакета bsdmainutils в Debian. Согласно следующему графику, bsdmainutils и vim-common должны иметь равную вероятность для установки:

http://qa.debian.org/popcon-png.php?packages=vim-common%2Cbsdmainutils&show_installed=1&want_legend=1&want_ticks=1

но тем не менее здесь версия, которая использует hexdump вместо xxd и позволяет избежать вызова tr:

echo -ne 'some random\nbytes' | hexdump -v -e '/1 "%02x"' | sed 's/\(..\)/%\1/g'

josch 21 сен. 2011, в 21:43

9

Хорошо сделано - приятно видеть однострочник, который использует только оболочку.
joelparkerhenderson 24 сен. 2011, в 01:10
1

xxd -plain должен произойти ПОСЛЕ tr -d '\n' !
qdii 08 июль 2012, в 16:24
2

@qdii почему? это не только сделало бы невозможным urlencode новых строк, но также неправильно вставило бы новые строки, созданные xxd, в вывод.
josch 14 июль 2012, в 16:26
1

@josch. Это просто неправильно. Во- первых, любые \n символы будут переведены xxd -plain в 0a . Не верьте мне на слово, попробуйте сами: echo -n -e '\n' | xxd -plain Это доказывает, что ваш tr -d '\n' здесь бесполезен, так как после xxd -plain не может быть никаких \n xxd -plain вторых, echo foobar добавляет свой собственный символ \n в конец строки символов, поэтому xxd -plain не подается с foobar как ожидалось, но с foobar\n . затем xxd -plain переводит его в некоторую символьную строку, оканчивающуюся на 0a , что делает его неподходящим для пользователя. Вы можете добавить -n к echo чтобы решить это.
qdii 14 июль 2012, в 22:49
0

Я удалю свои комментарии, как только это будет исправлено
qdii 14 июль 2012, в 22:50
3

Я не хочу быть грубым, если я так говорю. Это очень хороший сценарий, и я действительно использовал его :)
qdii 14 июль 2012, в 22:54
0

@qdii +1 за конструктивную критику
GuruM 19 июль 2012, в 07:29
4

@qdii действительно -n отсутствует для echo, но вызов xxd принадлежит перед вызовом tr -d . Он принадлежит так, что любая новая foobar в foobar переводится как xxd . tr -d после вызова xxd должен удалить строки, которые производит xxd. Кажется, у вас никогда не было достаточно длинного foobar, так что xxd производит переводы строки, но для длинных вводов это будет. Так что tr -d необходим. В отличие от вашего предположения, tr -d заключался не в том, чтобы удалять символы новой строки из входных данных, а из выходных данных xxd . Я хочу сохранить переводы строк во входных данных. Ваш единственный верный аргумент в том, что эхо добавляет ненужный перевод строки.
josch 20 июль 2012, в 09:44
1

@qdii и не обижайся - я просто думаю, что ты не прав, за исключением echo -n который я действительно пропустил
josch 20 июль 2012, в 09:53
2

@josch Я не знал, что xxd сделал это, спасибо за сообщение и за исправление небольшой ошибки :)
qdii 20 июль 2012, в 22:18

Показать ещё 8 комментариев

34

Я нахожу его более читаемым в python:

encoded_value=$(python -c "import urllib; print urllib.quote('''$value''')")

тройка 'гарантирует, что одинарные кавычки в значении не повредят. urllib находится в стандартной библиотеке. Он работает для примера для этого сумасшедшего (реального мира) url:

"http://www.rai.it/dl/audio/" "1264165523944Ho servito il re d'Inghilterra - Puntata 7

sandro 10 фев. 2010, в 10:40

2

У меня были некоторые проблемы с кавычками и специальными символами с тройным кавычком, это, казалось, работало практически для всех: encoded_value = "$ (echo -n" $ {data} "| python -c" import urllib; import sys; sys.stdout. write (urllib.quote (sys.stdin.read ())) ")";
sequoia mcdowell 14 нояб. 2011, в 14:33
0

Версия Python 3 будет иметь значение encoded_value=$(python3 -c "import urllib.parse; print (urllib.parse.quote('''$value'''))") .
Creshal 10 нояб. 2013, в 11:33
0

urllib.parse.quote не кодирует косую urllib.parse.quote «/». urlencode() { python3 -c 'import urllib.parse; import sys; print(urllib.parse.quote(sys.argv[1], safe=""))' "$1" }
Evgeniy Generalov 13 апр. 2014, в 08:47
1

python -c 'import urllib, sys; sys.stdout.writelines(urllib.quote_plus(l, safe="/\n") for l in sys.stdin)' почти не имеет проблем с кавычками и должен быть эффективным с точки зрения памяти / скорости (не проверено, за исключением косоглазия) )
Alois Mahdal 07 нояб. 2015, в 05:19
2

Было бы гораздо безопаснее ссылаться на sys.argv а не подставлять $value в строку, которая позже анализируется как код. Что если value содержит ''' + __import__("os").system("rm -rf ~") + ''' ?)
Charles Duffy 18 май 2016, в 20:45
0

Сделал мой день ... спасибо за это!
Marcello de Sales 14 сен. 2016, в 18:10
1

python -c "import urllib;print urllib.quote(raw_input())" <<< "$data"
Rockallite 09 фев. 2017, в 08:02

Показать ещё 5 комментариев

27

Я нашел следующий фрагмент, полезный для привязки к цепочке вызовов программ, где URI:: Escape не может быть установлен:

perl -p -e 's/([^A-Za-z0-9])/sprintf("%%%02X", ord($1))/seg'

(источник)

blueyed 10 нояб. 2009, в 21:46

4

работал на меня. Я изменил его на perl-lpe ... (буква ell). Это убрало завершающий перевод строки, который мне был нужен для моих целей.
JohnnyLambada 17 окт. 2012, в 18:52
1

К вашему сведению, чтобы сделать обратное, используйте perl -pe 's/\%(\w\w)/chr hex $1/ge' (источник: unix.stackexchange.com/questions/159253/… )
Sridhar-Sarnobat 10 нояб. 2015, в 19:46
2

В зависимости от того, какие именно символы вам нужно кодировать, вы можете упростить это до perl -pe 's/(\W)/sprintf("%%%02X", ord($1))/ge' который позволяет использовать буквы, цифры и подчеркивает, но кодирует все остальное.
robru 04 март 2016, в 09:30

Показать ещё 1 комментарий

26

один из вариантов, может быть уродливым, но простым:

urlencode() {
    local data
    if [[ $# != 1 ]]; then
        echo "Usage: $0 string-to-urlencode"
        return 1
    fi
    data="$(curl -s -o /dev/null -w %{url_effective} --get --data-urlencode "$1" "")"
    if [[ $? != 3 ]]; then
        echo "Unexpected error" 1>&2
        return 2
    fi
    echo "${data##/?}"
    return 0
}

Sergey 29 май 2012, в 11:45

1

Я думаю, что это очень умный способ повторно использовать кодировку URL cURL.
solidsnack 24 окт. 2012, в 15:17
11

Это абсолютно великолепно! Я действительно хотел бы, чтобы вы оставили это в одной строке, чтобы люди могли видеть, насколько все просто на самом деле. Чтобы URL кодировал результат команды date … date | curl -Gso /dev/null -w %{url_effective} --data-urlencode @- "" | cut -c 3- (Вы должны cut первые 2 символа, потому что выходные данные curl - это технически относительный URL со строкой запроса.)
Bruno Bronosky 02 март 2013, в 03:07
0

Мне нравится, насколько это умно, но, похоже, он не работает с моим curl 7.33.0. Работает в Debian Wheezy Box, которая имеет curl 7.26.0.
dequis 24 янв. 2014, в 16:37
0

Как насчет декодирования?
ceving 14 нояб. 2014, в 11:46
0

@dequis, хмм - если есть ошибка, то она исправлена с тех пор (отлично работает со сборкой macports из curl 7.48.0 на OS X). Можете ли вы выделить, как изменилось поведение?
Charles Duffy 18 май 2016, в 20:49
0

@CharlesDuffy Не знаю, что за ошибка, извини. Только что протестировал с 7.38.0 и 7.47.1, и это работает.
dequis 22 май 2016, в 03:05
2

@BrunoBronosky Ваш однострочный вариант хорош, но, по-видимому, добавляет «% 0A» в конец кодировки. Пользователи остерегаются. Версия функции, похоже, не имеет этой проблемы.
levigroker 10 авг. 2016, в 17:25
3

Чтобы избежать %0A в конце, используйте printf вместо echo .
kenorb 02 май 2018, в 00:11
1

один лайнер фантастический
Stephen Blum 30 авг. 2018, в 23:31

Показать ещё 7 комментариев

16

Если вы хотите запустить запрос GET и использовать чистый curl, просто добавьте --get в решение @Jacob.

Вот пример:

curl -v --get --data-urlencode "access_token=$(cat .fb_access_token)" https://graph.facebook.com/me/feed

Piotr Czapla 25 фев. 2011, в 14:20

14

Прямая ссылка на версию awk: http://www.shelldorado.com/scripts/cmds/urlencode
Я использовал его в течение многих лет, и он работает как шарм

:
##########################################################################
# Title      :  urlencode - encode URL data
# Author     :  Heiner Steven ([email protected])
# Date       :  2000-03-15
# Requires   :  awk
# Categories :  File Conversion, WWW, CGI
# SCCS-Id.   :  @(#) urlencode  1.4 06/10/29
##########################################################################
# Description
#   Encode data according to
#       RFC 1738: "Uniform Resource Locators (URL)" and
#       RFC 1866: "Hypertext Markup Language - 2.0" (HTML)
#
#   This encoding is used i.e. for the MIME type
#   "application/x-www-form-urlencoded"
#
# Notes
#    o  The default behaviour is not to encode the line endings. This
#   may not be what was intended, because the result will be
#   multiple lines of output (which cannot be used in an URL or a
#   HTTP "POST" request). If the desired output should be one
#   line, use the "-l" option.
#
#    o  The "-l" option assumes, that the end-of-line is denoted by
#   the character LF (ASCII 10). This is not true for Windows or
#   Mac systems, where the end of a line is denoted by the two
#   characters CR LF (ASCII 13 10).
#   We use this for symmetry; data processed in the following way:
#       cat | urlencode -l | urldecode -l
#   should (and will) result in the original data
#
#    o  Large lines (or binary files) will break many AWK
#       implementations. If you get the message
#       awk: record `...' too long
#        record number xxx
#   consider using GNU AWK (gawk).
#
#    o  urlencode will always terminate it output with an EOL
#       character
#
# Thanks to Stefan Brozinski for pointing out a bug related to non-standard
# locales.
#
# See also
#   urldecode
##########################################################################

PN=`basename "$0"`          # Program name
VER='1.4'

: ${AWK=awk}

Usage () {
    echo >&2 "$PN - encode URL data, $VER
usage: $PN [-l] [file ...]
    -l:  encode line endings (result will be one line of output)

The default is to encode each input line on its own."
    exit 1
}

Msg () {
    for MsgLine
    do echo "$PN: $MsgLine" >&2
    done
}

Fatal () { Msg "$@"; exit 1; }

set -- `getopt hl "$@" 2>/dev/null` || Usage
[ $# -lt 1 ] && Usage           # "getopt" detected an error

EncodeEOL=no
while [ $# -gt 0 ]
do
    case "$1" in
        -l) EncodeEOL=yes;;
    --) shift; break;;
    -h) Usage;;
    -*) Usage;;
    *)  break;;         # First file name
    esac
    shift
done

LANG=C  export LANG
$AWK '
    BEGIN {
    # We assume an awk implementation that is just plain dumb.
    # We will convert an character to its ASCII value with the
    # table ord[], and produce two-digit hexadecimal output
    # without the printf("%02X") feature.

    EOL = "%0A"     # "end of line" string (encoded)
    split ("1 2 3 4 5 6 7 8 9 A B C D E F", hextab, " ")
    hextab [0] = 0
    for ( i=1; i<=255; ++i ) ord [ sprintf ("%c", i) "" ] = i + 0
    if ("'"$EncodeEOL"'" == "yes") EncodeEOL = 1; else EncodeEOL = 0
    }
    {
    encoded = ""
    for ( i=1; i<=length ($0); ++i ) {
        c = substr ($0, i, 1)
        if ( c ~ /[a-zA-Z0-9.-]/ ) {
        encoded = encoded c     # safe character
        } else if ( c == " " ) {
        encoded = encoded "+"   # special handling
        } else {
        # unsafe character, encode it as a two-digit hex-number
        lo = ord [c] % 16
        hi = int (ord [c] / 16);
        encoded = encoded "%" hextab [hi] hextab [lo]
        }
    }
    if ( EncodeEOL ) {
        printf ("%s", encoded EOL)
    } else {
        print encoded
    }
    }
    END {
        #if ( EncodeEOL ) print ""
    }
' "$@"

MatthieuP 30 нояб. 2008, в 23:23

0

Есть ли простой вариант получить кодировку UTF-8 вместо ASCII?
avgvstvs 02 окт. 2015, в 16:16

10

Другой вариант - использовать jq:

jq -s -R -r @uri

-s (--slurp) считывает входные строки в массив, а -s -R (--slurp --raw-input) считывает ввод в одну строку. -r (--raw-output) выводит содержимое строк вместо строковых литералов JSON.

Или этот процент-кодирует все байты:

xxd -p|tr -d \\n|sed 's/../%&/g'

nisetama 22 дек. 2015, в 04:03

0

<3 это ... должно быть лучшим и приемлемым IMO (да, если вы можете сказать curl чтобы кодировать это работает, и если bash имеет встроенную функцию, которая была бы приемлемой - но jq кажется правильным, хотя я далек от достижения комфорта уровень с этим инструментом)
nhed 16 нояб. 2017, в 16:16
1

для всех, кто интересуется тем же, что и я: @uri - это не какая-то переменная, а буквальный фильтр jq, используемый для форматирования строк и экранирования; подробности смотрите в руководстве jq (извините, прямой ссылки нет, нужно искать @uri на странице ...)
ssc 13 июль 2018, в 11:48
0

версия xxd - это именно то, что я искал. Даже если он немного грязный, он короткий и не имеет зависимостей
Rian Sanderson 21 нояб. 2018, в 15:08

Показать ещё 1 комментарий

8

url=$(echo "$1" | sed -e 's/%/%25/g' -e 's/ /%20/g' -e 's/!/%21/g' -e 's/"/%22/g' -e 's/#/%23/g' -e 's/\$/%24/g' -e 's/\&/%26/g' -e 's/'\''/%27/g' -e 's/(/%28/g' -e 's/)/%29/g' -e 's/\*/%2a/g' -e 's/+/%2b/g' -e 's/,/%2c/g' -e 's/-/%2d/g' -e 's/\./%2e/g' -e 's/\//%2f/g' -e 's/:/%3a/g' -e 's/;/%3b/g' -e 's//%3e/g' -e 's/?/%3f/g' -e 's/@/%40/g' -e 's/\[/%5b/g' -e 's/\\/%5c/g' -e 's/\]/%5d/g' -e 's/\^/%5e/g' -e 's/_/%5f/g' -e 's/`/%60/g' -e 's/{/%7b/g' -e 's/|/%7c/g' -e 's/}/%7d/g' -e 's/~/%7e/g')

это будет кодировать строку внутри $1 и выводить ее в $url. хотя вам не нужно класть его в var, если хотите. BTW не включал sed для вкладки, думал, что он превратит его в пробелы.

manoflinux 11 янв. 2011, в 13:45

5

У меня такое ощущение, что это не рекомендуемый способ сделать это.
Cody Gray♦ 11 янв. 2011, в 13:27
2

объясните, пожалуйста, ваши чувства ... потому что то, что я изложил, работает и я использовал его в нескольких сценариях, поэтому я знаю, что оно работает для всех символов, которые я перечислил. поэтому, пожалуйста, объясните, почему кто-то не будет использовать мой код и использовать perl, так как заголовок «URLEncode from bash script», а не perl-скрипт.
manoflinux 08 фев. 2011, в 02:55
0

иногда не требуется раствор жемчуга, так что это может пригодиться
Yuval Rimar 31 окт. 2011, в 11:31
3

Это не рекомендуемый способ сделать это, потому что черный список - это плохая практика, и в любом случае это юникод.
Ekevoo 20 дек. 2011, в 14:16
0

Это было самое дружелюбное решение, совместимое с cat file.txt
mrwaim 20 янв. 2018, в 19:51

Показать ещё 3 комментария

7

Это может быть лучшим:

after=$(echo -e "$before" | od -An -tx1 | tr ' ' % | xargs printf "%s")

chenzhiwei 01 авг. 2013, в 10:42

0

Это работает для меня с двумя добавлениями: 1. замените -e на -n, чтобы избежать добавления новой строки в конец аргумента, и 2. добавьте «%%» в строку printf, чтобы поставить% перед каждой парой шестнадцатеричные цифры.
Rob Fagen 03 май 2016, в 23:26
0

работает после добавления $ впереди скобки after=$(echo -e ...
Roman Rhrn Nesterov 01 сен. 2016, в 08:22
0

Пожалуйста, объясните, как это работает. Команда od не распространена.
Mark Stosberg 19 нояб. 2018, в 00:47
0

Это не работает с OS X od потому что он использует другой формат вывода, чем GNU od . Например, printf aa|od -An -tx1 -v|tr \ - печатает -----------61--61-------------------------------------------------------- с OS X od и -61-61 с GNU od , Вы можете использовать od -An -tx1 -v|sed 's/ */ /g;s/ *$//'|tr \ %|tr -d \\n с od OS X или GNU od . xxd -p|sed 's/../%&/g'|tr -d \\n делает то же самое, хотя xxd отсутствует в POSIX, но od есть.
nisetama 08 янв. 2019, в 11:59

Показать ещё 2 комментария

7

Для тех из вас, кто ищет решение, которое не нуждается в perl, здесь нужно только hexdump и awk:

url_encode() {
 [ $# -lt 1 ] && { return; }

 encodedurl="$1";

 # make sure hexdump exists, if not, just give back the url
 [ ! -x "/usr/bin/hexdump" ] && { return; }

 encodedurl=`
   echo $encodedurl | hexdump -v -e '1/1 "%02x\t"' -e '1/1 "%_c\n"' |
   LANG=C awk '
     $1 == "20"                    { printf("%s",   "+"); next } # space becomes plus
     $1 ~  /0[adAD]/               {                      next } # strip newlines
     $2 ~  /^[a-zA-Z0-9.*()\/-]$/  { printf("%s",   $2);  next } # pass through what we can
                                   { printf("%%%s", $1)        } # take hex value of everything else
   '`
}

Сшитый из нескольких мест по сети и некоторых локальных проб и ошибок. Он отлично работает!

Louis Marascio 20 июнь 2010, в 00:23

6

uni2ascii очень удобно:

$ echo -ne '你好世界' | uni2ascii -aJ
%E4%BD%A0%E5%A5%BD%E4%B8%96%E7%95%8C

kev 26 нояб. 2012, в 09:37

2

Это не работает для символов внутри диапазона ASCII, для которых необходимо заключить в кавычки, например, % и пробел (последнее можно исправить с помощью флага -s )
Boldewyn 07 фев. 2013, в 14:59

6

Использование php из оболочки script:

value="http://www.google.com"
encoded=$(php -r "echo rawurlencode('$value');")
# encoded = "http%3A%2F%2Fwww.google.com"
echo $(php -r "echo rawurldecode('$encoded');")
# returns: "http://www.google.com"

Darren Weber 01 фев. 2012, в 00:53

5

Вы можете эмулировать javascript encodeURIComponent в perl. Здесь команда:

perl -pe 's/([^a-zA-Z0-9_.!~*()'\''-])/sprintf("%%%02X", ord($1))/ge'

Вы можете установить это как псевдоним bash в .bash_profile:

alias encodeURIComponent='perl -pe '\''s/([^a-zA-Z0-9_.!~*()'\''\'\'''\''-])/sprintf("%%%02X",ord($1))/ge'\'

Теперь вы можете подключиться к encodeURIComponent:

$ echo -n 'hèllo wôrld!' | encodeURIComponent
h%C3%A8llo%20w%C3%B4rld!

Klaus 20 янв. 2015, в 21:40

5

Если вы не хотите зависеть от Perl, вы также можете использовать sed. Это немного беспорядочно, поскольку каждый символ должен быть экранирован индивидуально. Сделайте файл со следующим содержимым и назовите его urlencode.sed

s/%/%25/g
s/ /%20/g
s/ /%09/g
s/!/%21/g
s/"/%22/g
s/#/%23/g
s/\$/%24/g
s/\&/%26/g
s/'\''/%27/g
s/(/%28/g
s/)/%29/g
s/\*/%2a/g
s/+/%2b/g
s/,/%2c/g
s/-/%2d/g
s/\./%2e/g
s/\//%2f/g
s/:/%3a/g
s/;/%3b/g
s//%3e/g
s/?/%3f/g
s/@/%40/g
s/\[/%5b/g
s/\\/%5c/g
s/\]/%5d/g
s/\^/%5e/g
s/_/%5f/g
s/`/%60/g
s/{/%7b/g
s/|/%7c/g
s/}/%7d/g
s/~/%7e/g
s/      /%09/g

Чтобы использовать его, выполните следующие действия.

STR1=$(echo "https://www.example.com/change&$ ^this to?%checkthe@-functionality" | cut -d\? -f1)
STR2=$(echo "https://www.example.com/change&$ ^this to?%checkthe@-functionality" | cut -d\? -f2)
OUT2=$(echo "$STR2" | sed -f urlencode.sed)
echo "$STR1?$OUT2"

Это разделит строку на часть, которая нуждается в кодировке, а часть, которая в порядке, закодирует нужную ей часть, затем сшивается вместе.

Вы можете поместить это в sh script для удобства, возможно, потребуется взять параметр для кодирования, поместить его на свой путь, а затем вы можете просто позвонить:

urlencode https://www.exxample.com?isThisFun=HellNo

_{источник}

Jay 17 нояб. 2008, в 19:55

4

Простая опция PHP:

echo 'part-that-needs-encoding' | php -R 'echo urlencode($argn);'

Ryan 26 фев. 2015, в 04:40

4

Здесь версия node:

uriencode() {
  node -p "encodeURIComponent('${1//\'/\\\'}')"
}

davidchambers 07 июль 2014, в 01:43

1

Не нарушится ли это, если в строке есть другие символы, которые недопустимы между одинарными кавычками, например, обратная косая черта или перевод строки?
Stuart P. Bentley 31 дек. 2016, в 19:09
0

Хорошая точка зрения. Если мы хотим избежать проблем со всеми проблемными символами в Bash, мы могли бы также выполнить замены напрямую и вообще избежать node . Я разместил решение только для Bash. :)
davidchambers 01 янв. 2017, в 02:46
1

Этот вариант, найденный в другом месте на странице, позволяет избежать проблемы с цитированием путем чтения значения из STDIN: node -p 'encodeURIComponent(require("fs").readFileSync(0))'
Mark Stosberg 19 нояб. 2018, в 01:02

Показать ещё 1 комментарий

3

Вопрос заключается в том, чтобы сделать это в bash, и нет необходимости в python или perl, поскольку на самом деле есть единственная команда, которая делает именно то, что вы хотите - "urlencode".

value=$(urlencode "${2}")

Это также намного лучше, поскольку, например, приведенный выше perl-ответ не кодирует все символы правильно. Попробуйте с длинной чертой, которую вы получаете от Word, и получите неправильную кодировку.

Примечание. Для предоставления этой команды вам нужны "gridsite-clients".

Dylan 14 нояб. 2014, в 12:52

1

Моя версия bash (GNU 3.2) не имеет urlencode . Какую версию ты используешь?
Sridhar-Sarnobat 10 нояб. 2015, в 19:27
1

У меня есть 4.3.42, но команда urlencode предоставляется "gridsite-clients". Попробуйте установить это, и все будет в порядке.
Dylan 12 нояб. 2015, в 12:45
3

Таким образом, ваш ответ не лучше, чем любой, требующий установки других вещей (python, perl, lua,…)
Cyrille Pontvieux 27 июль 2017, в 07:36
0

За исключением того, что требуется только установка одной утилиты вместо всего языка (и библиотек), плюс очень просто и понятно, что она делает.
Dylan 28 июль 2017, в 13:29

Показать ещё 2 комментария

3

Другой подход php:

echo "encode me" | php -r "echo urlencode(file_get_contents('php://stdin'));"

jan halfar 18 дек. 2013, в 11:11

0

почему я получаю: кодировать + меня% 0A
raf 19 сен. 2014, в 18:08
2

echo добавит символ новой строки (hex 0xa ). Чтобы остановить это, используйте echo -n .
Mathew Hall 10 окт. 2014, в 10:01

3

Ruby, для полноты

value="$(ruby -r cgi -e 'puts CGI.escape(ARGV[0])' "$2")"

kristi 20 июнь 2012, в 00:22

2

Здесь Bash решение, которое не вызывает никаких внешних программ:

uriencode() {
  s="${1//'%'/'%25'}"
  s="${s//' '/'%20'}"
  s="${s//'"'/'%22'}"
  s="${s//'#'/'%23'}"
  s="${s//'$'/'%24'}"
  s="${s//'&'/'%26'}"
  s="${s//'+'/'%2B'}"
  s="${s//','/'%2C'}"
  s="${s//'/'/'%2F'}"
  s="${s//':'/'%3A'}"
  s="${s//';'/'%3B'}"
  s="${s//'='/'%3D'}"
  s="${s//'?'/'%3F'}"
  s="${s//'@'/'%40'}"
  s="${s//'['/'%5B'}"
  s="${s//']'/'%5D'}"
  printf %s "$s"
}

davidchambers 01 янв. 2017, в 04:35

3

Это ведет себя по-разному между версиями Bash. На RHEL 6.9 bash равен 4.1.2 и включает одинарные кавычки. В то время как Debian 9 и bash 4.4.12 хороши с одинарными кавычками. Для меня удаление одинарных кавычек заставило его работать на обоих. s = "$ {s // '' /% 2C}"
muni764 23 май 2018, в 15:28
0

Я обновил ответ, чтобы отразить ваши выводы, @ muni764.
davidchambers 23 май 2018, в 21:01

2

Вот функция POSIX для этого:

encodeURIComponent() {
  awk 'BEGIN {while (y++ < 125) z[sprintf("%c", y)] = y
  while (y = substr(ARGV[1], ++j, 1))
  q = y ~ /[[:alnum:]_.!~*\47()-]/ ? q y : q sprintf("%%%02X", z[y])
  print q}' "$1"
}

Пример:

value=$(encodeURIComponent "$2")

Источник

Steven Penny 31 дек. 2016, в 06:01

2

Здесь однострочное преобразование с использованием Lua, похожее на blueyed answer, за исключением всего RFC 3986 Unreserved Characters оставил unencoded (например этот ответ):

url=$(echo 'print((arg[1]:gsub("([^%w%-%.%_%~])",function(c)return("%%%02X"):format(c:byte())end)))' | lua - "$1")

Кроме того, вам может потребоваться убедиться, что строки новой строки в вашей строке преобразуются из LF в CRLF, и в этом случае вы можете вставить gsub("\r?\n", "\r\n") в цепочку до процентного кодирования.

Здесь вариант, который в нестандартном стиле приложения /x -www-form-urlencoded, выполняет эту нормализацию новой строки, а также кодирует пробелы как '+' вместо ' %20' (который, вероятно, может быть добавлен в фрагмент Perl с использованием аналогичного метода).

url=$(echo 'print((arg[1]:gsub("\r?\n", "\r\n"):gsub("([^%w%-%.%_%~ ]))",function(c)return("%%%02X"):format(c:byte())end):gsub(" ","+"))' | lua - "$1")

Stuart P. Bentley 29 апр. 2011, в 20:04

1

Это версия orwellophile ответа ksh, содержащая функции rawurlencode и rawurldecode (ссылка: Как скопировать данные для команды curl?). Мне не хватает репутации, чтобы опубликовать комментарий, следовательно, новый пост.

#!/bin/ksh93

function rawurlencode
{
    typeset string="${1}"
    typeset strlen=${#string}
    typeset encoded=""

    for (( pos=0 ; pos<strlen ; pos++ )); do
        c=${string:$pos:1}
        case "$c" in
            [-_.~a-zA-Z0-9] ) o="${c}" ;;
            * )               o=$(printf '%%%02x' "'$c")
        esac
        encoded+="${o}"
    done
    print "${encoded}"
}

function rawurldecode
{
    printf $(printf '%b' "${1//%/\\x}")
}

print $(rawurlencode "C++")     # --> C%2b%2b
print $(rawurldecode "C%2b%2b") # --> C++

Ray Burgemeestre 25 дек. 2013, в 15:41

1

После установки php я использую этот способ:

URL_ENCODED_DATA=`php -r "echo urlencode('$DATA');"`

ajaest 15 авг. 2013, в 13:19

0

Что будет анализировать URL-адреса лучше, чем javascript?

node -p "encodeURIComponent('$url')"

Nestor Urquiza 12 апр. 2017, в 19:11

0

Вне сферы действия вопроса. Не баш, не локон. Даже если я уверен, что работает очень хорошо, если узел доступен.
Cyrille Pontvieux 27 июль 2017, в 07:32
0

Почему это голосование с понижением, а не с ответами на python / perl? Кроме того, как это не отвечает на оригинальный вопрос «Как urlencode данных для команды curl?». Это может быть использовано из скрипта bash, а результат может быть передан команде curl.
Nestor Urquiza 31 июль 2017, в 11:54
0

Я тоже проголосовал против остальных. Вопрос был в том, как сделать это в скрипте bash. Если используется другой язык, такой как node / js, python или perl, тогда нет необходимости использовать curl напрямую.
Cyrille Pontvieux 03 авг. 2017, в 14:35
0

Нет необходимости использовать curl, если в вашем распоряжении есть другой язык, но это не значит, что вы не можете его использовать. С точки зрения bash, curl - это внешняя команда, как и узел. Решение, которое я предлагаю, состоит в том, чтобы использовать node и curl внутри bash-скрипта. Да, вам нужна зависимость, но это все-таки bash. Я не предлагаю делать всю работу с узлом. Поэтому это правильное решение вопроса «Как urlencode данных для команды curl ?». Ответ на вопрос: «Урленкодировать данные с помощью однострочного узла».
Nestor Urquiza 04 авг. 2017, в 15:03
2

В то время как я не удосужился понизить голос, проблема с этой командой состоит в том, что она требует, чтобы данные были должным образом экранированы для использования в JavaScript. Как попробовать это с одинарными кавычками и некоторым безумием с обратной косой чертой. Если вы хотите использовать узел, вам лучше читать материал из stdin, например, node -p 'encodeURIComponent(require("fs").readFileSync(0))'
Michael Krelin - hacker 06 янв. 2018, в 18:01
0

Это мое любимое решение, потому что моя автоматизация представляет собой смесь bash и Node.js , поэтому зависимость от Node.js не проблема, а решение просто и легко читаемо.
Mark Stosberg 19 нояб. 2018, в 00:49
1

Будьте осторожны с решением @ MichaelKrelin-hacker, если вы передаете данные из STDIN, убедитесь, что не добавляете завершающий символ новой строки. Например, echo | ... неправильно, а echo -n | ... подавляет перевод строки.
Mark Stosberg 19 нояб. 2018, в 00:57
0

@MarkStosberg, хорошая мысль. Если перевод строки нежелателен, его также можно обрезать в javascript.
Michael Krelin - hacker 19 нояб. 2018, в 08:08

Показать ещё 6 комментариев

0

Вот моя версия для загрузочной ящички busybox для встроенной системы, я изначально принял вариант Orwellophile:

urlencode()
{
    local S="${1}"
    local encoded=""
    local ch
    local o
    for i in $(seq 0 $((${#S} - 1)) )
    do
        ch=${S:$i:1}
        case "${ch}" in
            [-_.~a-zA-Z0-9]) 
                o="${ch}"
                ;;
            *) 
                o=$(printf '%%%02x' "'$ch")                
                ;;
        esac
        encoded="${encoded}${o}"
    done
    echo ${encoded}
}

urldecode() 
{
    # urldecode <string>
    local url_encoded="${1//+/ }"
    printf '%b' "${url_encoded//%/\\x}"
}

nulleight 31 янв. 2017, в 11:20

Ещё вопросы

Смотрите также: Как декодировать строку в кодировке URL в оболочке? для не скручиваемых решений.
Смотрите также: Как я могу кодировать и декодировать строки в процентах в командной строке?
Текущая версия не страдает от этой ошибки.
+1 для bash-реализации rawurldecode, не знал, что printf сделал% x или -v
@ Pumbaa80 извините, моя вина за то, что я все еще использую Backfire 10.03 r20728. Спасибо за редактирование, я думал, что на самом деле мне придется использовать свой мозг на секунду: p
@ Pumbaa80: только что проверил первые правки (rawurldecode), но все, что красный и зеленый, повредили мой мыслитель - но версия, которая сейчас работает, составляет 100%. так что, если я ранее написал что-то отличное от этого, у меня был высокий клей. спасибо, что поймали это :)
К сожалению, этот скрипт завершается ошибкой на некоторых символах, таких как 'é' и '½', выводя 'e% FFFFFFFFFFFFFFCC' и '% FFFFFFFFFFFFFFC2' соответственно (я полагаю, b / c цикла для каждого символа).
@ Любна: Вы, должно быть, используете BASH 3.x, прекрасно работает в BASH 4. Я не знаю простого способа исправить это, например printf '%%% d' "'é"
@ Любна: извините, я пыталась найти быстрое решение для BASH 3, но не смогла. Боюсь, вам просто придется использовать более медленный метод из других источников на этой странице. Или отправьте новый вопрос с просьбой дать ответ для работы с BASH 3 :)
Он не работает для меня в Bash 4.3.11 (1). Строка Jogging «à l'Hèze» генерирует Jogging%20%abà%20l%27Hèze%bb который не может быть decodeURIComponent в JS decodeURIComponent :(
В этом первом блоке кода что означает последний параметр для printf? То есть, почему это двойная кавычка, одинарная кавычка, знак доллара, буква с, двойная кавычка? Одинаковая кавычка делает?
@dmcontador - это всего лишь скромный bash-скрипт, в котором нет концепции многобайтовых символов или юникода. Когда он видит символ, подобный \u0144 ( \u0144 ), он наивно выводит% 144, ╡ ( \u2561 ) будет выводиться как% 2561. Правильные необработанные ответы для них будут% C5% 84% 0A и% E2% 95% A1 соответственно.
@ColinFraizer одиночная кавычка служит для преобразования следующего символа в его числовое значение. ссылка pubs.opengroup.org/onlinepubs/9699919799/utilities/...
URI :: Escape может быть не установлен, проверьте мой ответ в этом случае.
Это не сработает, если $ 2 содержит апостроф.
Я исправил это (используйте echo , pipe и <> ), и теперь он работает, даже когда $ 2 содержит апостроф или двойные кавычки. Спасибо!
Вы также покончили с echo : value="$(perl -MURI::Escape -e 'print uri_escape($ARGV[0]);' "$2")"
Версия Криса Джонсена лучше. У меня было $ {True} в моем тестовом выражении, и использование этого через echo вызвало расширение переменной uri_escape / Perl.
@thecoshman, вы предлагаете увидеть ответ, написанный на vanilla bash, без каких-либо внешних утилит, например, bash4, perl, awk, cat, cut, xxd и т. д.? (см. другие ответы ниже). (Фактически) все, что вы напишите, будет зависеть от внешней / версии, так как vanilla bash не настолько мощен. Мог бы хорошо научиться жить с этим. Или, возможно, с помощью геркулесовых усилий вы могли бы достичь этого. Вы действительно хотите сделать это, а не писать что-то намного, намного проще в perl / python / awk / etc.?
@ jrw32982 возможно я плохо себя выразил. Такие вещи, как sed, awk, cat - это инструменты, на которые вы можете установить гарантию 99,999%, однако Perl может не всегда быть на вашей машине. Да, Perl - отличное решение, но не очень помогает в (не очень маловероятной) ситуации, в которой у вас нет / не может быть Perl (например, администраторы).
@thecoshman Моя точка зрения заключалась в том, что даже сценарии, использующие только тот набор инструментов, который, как вы утверждаете, находятся в диапазоне 99,999%, будут подвержены различиям версий на разных компьютерах. Посмотрите комментарии bash4 и bash3 для ответа Орвеллофила. Итак, я не согласен, что это плохой ответ из-за использования Perl. Это просто ответ с предварительными требованиями, как и практически каждый ответ. FWIW, с установленным Perl в моем опыте + 99% + для Linux, Solaris, AIX, HP / UX. YMMV.
@ jrw32982 да, оглядываясь назад, есть другой язык, на котором можно выполнить эту задачу - это хорошо. Если бы я мог, я бы забрал свое пониженное голосование, но, увы, оно сейчас заблокировано.
Хорошо сделано - приятно видеть однострочник, который использует только оболочку.
xxd -plain должен произойти ПОСЛЕ tr -d '\n' !
@qdii почему? это не только сделало бы невозможным urlencode новых строк, но также неправильно вставило бы новые строки, созданные xxd, в вывод.
@josch. Это просто неправильно. Во- первых, любые \n символы будут переведены xxd -plain в 0a . Не верьте мне на слово, попробуйте сами: echo -n -e '\n' | xxd -plain Это доказывает, что ваш tr -d '\n' здесь бесполезен, так как после xxd -plain не может быть никаких \n xxd -plain вторых, echo foobar добавляет свой собственный символ \n в конец строки символов, поэтому xxd -plain не подается с foobar как ожидалось, но с foobar\n . затем xxd -plain переводит его в некоторую символьную строку, оканчивающуюся на 0a , что делает его неподходящим для пользователя. Вы можете добавить -n к echo чтобы решить это.
Я удалю свои комментарии, как только это будет исправлено
Я не хочу быть грубым, если я так говорю. Это очень хороший сценарий, и я действительно использовал его :)
@qdii действительно -n отсутствует для echo, но вызов xxd принадлежит перед вызовом tr -d . Он принадлежит так, что любая новая foobar в foobar переводится как xxd . tr -d после вызова xxd должен удалить строки, которые производит xxd. Кажется, у вас никогда не было достаточно длинного foobar, так что xxd производит переводы строки, но для длинных вводов это будет. Так что tr -d необходим. В отличие от вашего предположения, tr -d заключался не в том, чтобы удалять символы новой строки из входных данных, а из выходных данных xxd . Я хочу сохранить переводы строк во входных данных. Ваш единственный верный аргумент в том, что эхо добавляет ненужный перевод строки.
@qdii и не обижайся - я просто думаю, что ты не прав, за исключением echo -n который я действительно пропустил
@josch Я не знал, что xxd сделал это, спасибо за сообщение и за исправление небольшой ошибки :)
У меня были некоторые проблемы с кавычками и специальными символами с тройным кавычком, это, казалось, работало практически для всех: encoded_value = "$ (echo -n" $ {data} "| python -c" import urllib; import sys; sys.stdout. write (urllib.quote (sys.stdin.read ())) ")";
Версия Python 3 будет иметь значение encoded_value=$(python3 -c "import urllib.parse; print (urllib.parse.quote('''$value'''))") .
urllib.parse.quote не кодирует косую urllib.parse.quote «/». urlencode() { python3 -c 'import urllib.parse; import sys; print(urllib.parse.quote(sys.argv[1], safe=""))' "$1" }
python -c 'import urllib, sys; sys.stdout.writelines(urllib.quote_plus(l, safe="/\n") for l in sys.stdin)' почти не имеет проблем с кавычками и должен быть эффективным с точки зрения памяти / скорости (не проверено, за исключением косоглазия) )
Было бы гораздо безопаснее ссылаться на sys.argv а не подставлять $value в строку, которая позже анализируется как код. Что если value содержит ''' + __import__("os").system("rm -rf ~") + ''' ?)
Сделал мой день ... спасибо за это!
python -c "import urllib;print urllib.quote(raw_input())" <<< "$data"
работал на меня. Я изменил его на perl-lpe ... (буква ell). Это убрало завершающий перевод строки, который мне был нужен для моих целей.
К вашему сведению, чтобы сделать обратное, используйте perl -pe 's/\%(\w\w)/chr hex $1/ge' (источник: unix.stackexchange.com/questions/159253/… )
В зависимости от того, какие именно символы вам нужно кодировать, вы можете упростить это до perl -pe 's/(\W)/sprintf("%%%02X", ord($1))/ge' который позволяет использовать буквы, цифры и подчеркивает, но кодирует все остальное.
Я думаю, что это очень умный способ повторно использовать кодировку URL cURL.
Это абсолютно великолепно! Я действительно хотел бы, чтобы вы оставили это в одной строке, чтобы люди могли видеть, насколько все просто на самом деле. Чтобы URL кодировал результат команды date … date | curl -Gso /dev/null -w %{url_effective} --data-urlencode @- "" | cut -c 3- (Вы должны cut первые 2 символа, потому что выходные данные curl - это технически относительный URL со строкой запроса.)
Мне нравится, насколько это умно, но, похоже, он не работает с моим curl 7.33.0. Работает в Debian Wheezy Box, которая имеет curl 7.26.0.
@dequis, хмм - если есть ошибка, то она исправлена с тех пор (отлично работает со сборкой macports из curl 7.48.0 на OS X). Можете ли вы выделить, как изменилось поведение?
@CharlesDuffy Не знаю, что за ошибка, извини. Только что протестировал с 7.38.0 и 7.47.1, и это работает.
@BrunoBronosky Ваш однострочный вариант хорош, но, по-видимому, добавляет «% 0A» в конец кодировки. Пользователи остерегаются. Версия функции, похоже, не имеет этой проблемы.
Чтобы избежать %0A в конце, используйте printf вместо echo .
Есть ли простой вариант получить кодировку UTF-8 вместо ASCII?
<3 это ... должно быть лучшим и приемлемым IMO (да, если вы можете сказать curl чтобы кодировать это работает, и если bash имеет встроенную функцию, которая была бы приемлемой - но jq кажется правильным, хотя я далек от достижения комфорта уровень с этим инструментом)
для всех, кто интересуется тем же, что и я: @uri - это не какая-то переменная, а буквальный фильтр jq, используемый для форматирования строк и экранирования; подробности смотрите в руководстве jq (извините, прямой ссылки нет, нужно искать @uri на странице ...)
версия xxd - это именно то, что я искал. Даже если он немного грязный, он короткий и не имеет зависимостей
У меня такое ощущение, что это не рекомендуемый способ сделать это.
объясните, пожалуйста, ваши чувства ... потому что то, что я изложил, работает и я использовал его в нескольких сценариях, поэтому я знаю, что оно работает для всех символов, которые я перечислил. поэтому, пожалуйста, объясните, почему кто-то не будет использовать мой код и использовать perl, так как заголовок «URLEncode from bash script», а не perl-скрипт.
иногда не требуется раствор жемчуга, так что это может пригодиться
Это не рекомендуемый способ сделать это, потому что черный список - это плохая практика, и в любом случае это юникод.
Это было самое дружелюбное решение, совместимое с cat file.txt
Это работает для меня с двумя добавлениями: 1. замените -e на -n, чтобы избежать добавления новой строки в конец аргумента, и 2. добавьте «%%» в строку printf, чтобы поставить% перед каждой парой шестнадцатеричные цифры.
работает после добавления $ впереди скобки after=$(echo -e ...
Пожалуйста, объясните, как это работает. Команда od не распространена.
Это не работает с OS X od потому что он использует другой формат вывода, чем GNU od . Например, printf aa|od -An -tx1 -v|tr \ - печатает -----------61--61-------------------------------------------------------- с OS X od и -61-61 с GNU od , Вы можете использовать od -An -tx1 -v|sed 's/ */ /g;s/ *$//'|tr \ %|tr -d \\n с od OS X или GNU od . xxd -p|sed 's/../%&/g'|tr -d \\n делает то же самое, хотя xxd отсутствует в POSIX, но od есть.
Это не работает для символов внутри диапазона ASCII, для которых необходимо заключить в кавычки, например, % и пробел (последнее можно исправить с помощью флага -s )
Не нарушится ли это, если в строке есть другие символы, которые недопустимы между одинарными кавычками, например, обратная косая черта или перевод строки?
Хорошая точка зрения. Если мы хотим избежать проблем со всеми проблемными символами в Bash, мы могли бы также выполнить замены напрямую и вообще избежать node . Я разместил решение только для Bash. :)
Этот вариант, найденный в другом месте на странице, позволяет избежать проблемы с цитированием путем чтения значения из STDIN: node -p 'encodeURIComponent(require("fs").readFileSync(0))'
Моя версия bash (GNU 3.2) не имеет urlencode . Какую версию ты используешь?
У меня есть 4.3.42, но команда urlencode предоставляется "gridsite-clients". Попробуйте установить это, и все будет в порядке.
Таким образом, ваш ответ не лучше, чем любой, требующий установки других вещей (python, perl, lua,…)
За исключением того, что требуется только установка одной утилиты вместо всего языка (и библиотек), плюс очень просто и понятно, что она делает.
почему я получаю: кодировать + меня% 0A
echo добавит символ новой строки (hex 0xa ). Чтобы остановить это, используйте echo -n .
Это ведет себя по-разному между версиями Bash. На RHEL 6.9 bash равен 4.1.2 и включает одинарные кавычки. В то время как Debian 9 и bash 4.4.12 хороши с одинарными кавычками. Для меня удаление одинарных кавычек заставило его работать на обоих. s = "$ {s // '' /% 2C}"
Я обновил ответ, чтобы отразить ваши выводы, @ muni764.
Вне сферы действия вопроса. Не баш, не локон. Даже если я уверен, что работает очень хорошо, если узел доступен.
Почему это голосование с понижением, а не с ответами на python / perl? Кроме того, как это не отвечает на оригинальный вопрос «Как urlencode данных для команды curl?». Это может быть использовано из скрипта bash, а результат может быть передан команде curl.
Я тоже проголосовал против остальных. Вопрос был в том, как сделать это в скрипте bash. Если используется другой язык, такой как node / js, python или perl, тогда нет необходимости использовать curl напрямую.
Нет необходимости использовать curl, если в вашем распоряжении есть другой язык, но это не значит, что вы не можете его использовать. С точки зрения bash, curl - это внешняя команда, как и узел. Решение, которое я предлагаю, состоит в том, чтобы использовать node и curl внутри bash-скрипта. Да, вам нужна зависимость, но это все-таки bash. Я не предлагаю делать всю работу с узлом. Поэтому это правильное решение вопроса «Как urlencode данных для команды curl ?». Ответ на вопрос: «Урленкодировать данные с помощью однострочного узла».
В то время как я не удосужился понизить голос, проблема с этой командой состоит в том, что она требует, чтобы данные были должным образом экранированы для использования в JavaScript. Как попробовать это с одинарными кавычками и некоторым безумием с обратной косой чертой. Если вы хотите использовать узел, вам лучше читать материал из stdin, например, node -p 'encodeURIComponent(require("fs").readFileSync(0))'
Это мое любимое решение, потому что моя автоматизация представляет собой смесь bash и Node.js , поэтому зависимость от Node.js не проблема, а решение просто и легко читаемо.
Будьте осторожны с решением @ MichaelKrelin-hacker, если вы передаете данные из STDIN, убедитесь, что не добавляете завершающий символ новой строки. Например, echo | ... неправильно, а echo -n | ... подавляет перевод строки.
@MarkStosberg, хорошая мысль. Если перевод строки нежелателен, его также можно обрезать в javascript.

Jacob R · Accepted Answer · 2010-01-08T13-35-00.000Z

Использовать curl --data-urlencode; от man curl:

Это данные сообщений, аналогичные другим параметрам --data, за исключением того, что это выполняет кодирование URL. Чтобы быть совместимым с CGI, часть <data> должна начинаться с имени, за которым следует разделитель и спецификация содержимого.

Пример использования:

curl \
    --data-urlencode "paramName=value" \
    --data-urlencode "secondParam=value" \
    http://example.com

Подробнее см. справочную страницу.

Для этого требуется curl 7.18.0 или новее (выпущено в январе 2008 г.). Используйте curl -V, чтобы проверить, какая у вас версия.

Кажется, работает только для HTTP POST. Документация здесь: curl.haxx.se/docs/manpage.html#--data-urlencode
@StanJames Если вы используете его так, curl также может выполнять кодирование для запроса GET. curl -G --data-urlencode "blah=df ssdf sdf" --data-urlencode "blah2=dfsdf sdfsd " http://whatever.com/whatever
@kberg на самом деле, это будет работать только для данных запроса. curl добавит '?' с последующим параметром urlencoded. Если вы хотите urlencode некоторого постфикса url (например, CouchDB GET для некоторого идентификатора документа), то --data-urlencode не будет работать.
Не работает для curl --data-urlencode "description=![image]($url)" www.example.com . Есть идеи почему? `
Я хочу, чтобы URL кодировал путь URL (который используется в качестве параметра в конечной точке API REST). Здесь нет параметров строки запроса. Как мне сделать это для запроса GET?
Это не работает для --data-urlencode "key = special" string "" Чего нам здесь не хватает?