curlコマンドのデータをurlencodeするにはどうすればよいですか？

Question

テスト用のbashスクリプトを作成して、パラメータを受け取り、それをcurlを介してWebサイトに送信します。特殊文字が正しく処理されるように、値をURLエンコードする必要があります。これを行うための最良の方法は何ですか？

これが私の基本的なスクリプトです。

#!/bin/bash
Host=${1:?'bad Host'}
value=$2
shift
shift
curl -v -d "param=${value}" http://${Host}/somepath $@

これが私の基本的なスクリプトです。

#!/bin/bash Host=${1:?'bad Host'} value=$2 shift shift curl -v -d "param=${value}" http://${Host}/somepath $@

Jacob R · Accepted Answer

curl --data-urlencodeを使用してください。 man curlから：

これはURLエンコードを実行することを除いて他の--dataオプションと同様にデータをポストします。 CGIに準拠するには、<data>部分は名前で始まり、その後に区切り文字とコンテンツ仕様が続くはずです。

使用例

curl \ --data-urlencode "paramName=value" \ --data-urlencode "secondParam=value" \ http://example.com

詳しくは manページを見てください。

これには curl 7.18.0以降（2008年1月リリース）が必要です。 curl -Vを使ってあなたが持っているバージョンを確認してください。

Orwellophile · Answer

これが純粋なBASHの答えです。

rawurlencode() { local string="${1}" local strlen=${#string} local encoded="" local pos c o for (( pos=0 ; pos<strlen ; pos++ )); do c=${string:$pos:1} case "$c" in [-_.~a-zA-Z0-9] ) o="${c}" ;; * ) printf -v o '%%%02x' "'$c" esac encoded+="${o}" done echo "${encoded}" # You can either set a return variable (FASTER) REPLY="${encoded}" #+or echo the result (EASIER)... or both... :p }

あなたは2つの方法でそれを使用することができます。

easier: echo http://url/q?=$( rawurlencode "$args" ) faster: rawurlencode "$args"; echo http://url/q?${REPLY}

[編集]

これが、対応するrawurldecode（）関数です。

# Returns a string in which the sequences with percent (%) signs followed by # two hex digits have been replaced with literal characters. rawurldecode() { # This is perhaps a risky gambit, but since all escape characters must be # encoded, we can replace %NN with \xNN and pass the lot to printf -b, which # will decode hex for us printf -v REPLY '%b' "${1//%/\x}" # You can either set a return variable (FASTER) echo "${REPLY}" #+or echo the result (EASIER)... or both... :p }

マッチングセットを使って、簡単なテストを実行できます。

$ diff rawurlencode.inc.sh \ <( rawurldecode "$( rawurlencode "$( cat rawurlencode.inc.sh )" )" ) \ && echo Matched Output: Matched

そして、もしあなたが本当に外部ツールが必要だと本当に感じているなら（それはもっと速くなるでしょう、そしてバイナリファイルなどをするかもしれません...）私はこれを私のOpenWRTルータで見つけました...

replace_value=$(echo $replace_value | sed -f /usr/lib/ddns/url_escape.sed)

Url_escape.sedは、次の規則を含むファイルです。

# sed url escaping s:%:%25:g s: :%20:g s:<:%3C:g s:>:%3E:g s:#:%23:g s:{:%7B:g s:}:%7D:g s:|:%7C:g s:\:%5C:g s:\^:%5E:g s:~:%7E:g s:$$:%5B:g s:$$:%5D:g s:`:%60:g s:;:%3B:g s:/:%2F:g s:?:%3F:g s^:^%3A^g s:@:%40:g s:=:%3D:g s:&:%26:g s:\$:%24:g s:\!:%21:g s:\*:%2A:g

dubek · Answer

Bashスクリプトの2行目でPerlのURI::Escapeモジュールとuri_escape関数を使用してください。

... value="$(Perl -MURI::Escape -e 'print uri_escape($ARGV[0]);' "$2")" ...

編集： Chris Johnsenがコメントで提案しているように、引用の問題を修正しました。ありがとうございます。

josch · Answer

完全を期すために、sedまたはawkを使用する多くの解決策は、特殊な文字セットのみを変換するため、コードサイズが非常に大きくなり、エンコードする必要がある他の特殊文字も変換しません。

urlencodeへの安全な方法は、すべての1バイトをエンコードすることです。

echo -ne 'some random\nbytes' | xxd -plain | tr -d '\n' | sed 's/$..$/%\1/g'

ここではxxdは入力が文字ではなくバイトとして扱われるように注意しています。

編集：

xxdはDebianのvim-commonパッケージに同梱されていますが、インストールされていないシステムにインストールされていませんでした。別の方法は、Debianのbsdmainutilsパッケージからhexdumpを使用することです。次のグラフによると、bsdmainutilsとvim-commonはほぼ等しい確率でインストールされるはずです。

http://qa.debian.org/popcon-png.php?packages=vim-common%2Cbsdmainutils&show_installed=1&want_legend=1&want_ticks=1

それにもかかわらず、ここでもhexdumpの代わりにxxdを使用し、trの呼び出しを回避できるバージョンがあります。

echo -ne 'some random\nbytes' | hexdump -v -e '/1 "%02x"' | sed 's/$..$/%\1/g'

Sergey · Answer

変種の1つは、醜いかもしれませんが簡単です：

urlencode() { local data if [[ $# != 1 ]]; then echo "Usage: $0 string-to-urlencode" return 1 fi data="$(curl -s -o /dev/null -w %{url_effective} --get --data-urlencode "$1" "")" if [[ $? != 3 ]]; then echo "Unexpected error" 1>&2 return 2 fi echo "${data##/?}" return 0 }

これはたとえば、ワンライナーバージョンです（ Bruno ）。

date | curl -Gso /dev/null -w %{url_effective} --data-urlencode @- "" | cut -c 3-

sandro · Answer

私はそれをpythonで読みやすくしています。

encoded_value=$(python -c "import urllib; print urllib.quote('''$value''')")

トリプルは、値の中の一重引用符が害を受けないことを保証します。 urllibは標準ライブラリにあります。それはこのクレイジーな（実世界の）URLを例にするのに役立ちます：

"http://www.rai.it/dl/audio/" "1264165523944Ho servito il re d'Inghilterra - Puntata 7

nisetama · Answer

別のオプションはjqを使うことです。

jq -sRr @uri

-R（--raw-input）は入力行をJSONとして解析するのではなく文字列として扱い、-sR（--Slurp --raw-input）は入力を単一の文字列に読み込みます。 -r（--raw-output）は、JSON文字列リテラルの代わりに文字列の内容を出力します。

入力に改行が含まれていない場合（または%0Aとしてエスケープしたくない場合）、jq -Rr @uriオプションなしで-sだけを使用できます。

あるいは、これはすべてのバイトをパーセントエンコードします。

xxd -p|tr -d \n|sed 's/../%&/g'

blueyed · Answer

URI :: Escapeがインストールされていない可能性がある一連のプログラム呼び出しに貼り付けるには、次のコードが便利です。

Perl -p -e 's/([^A-Za-z0-9])/sprintf("%%%02X", ord($1))/seg'

（ソース）

Piotr Czapla · Answer

GETリクエストを実行して純粋なcurlを使用したい場合は、@ Jacobのソリューションに--getを追加してください。

これが一例です。

curl -v --get --data-urlencode "access_token=$(cat .fb_access_token)" https://graph.facebook.com/me/feed

MatthieuP · Answer

Awkバージョンへの直接リンク： http://www.shelldorado.com/scripts/cmds/urlencode
私は何年も使っていて、それは魅力のように働きます

: ########################################################################## # Title : urlencode - encode URL data # Author : Heiner Steven (heiner.steven@odn.de) # Date : 2000-03-15 # Requires : awk # Categories : File Conversion, WWW, CGI # SCCS-Id. : @(#) urlencode 1.4 06/10/29 ########################################################################## # Description # Encode data according to # RFC 1738: "Uniform Resource Locators (URL)" and # RFC 1866: "Hypertext Markup Language - 2.0" (HTML) # # This encoding is used i.e. for the MIME type # "application/x-www-form-urlencoded" # # Notes # o The default behaviour is not to encode the line endings. This # may not be what was intended, because the result will be # multiple lines of output (which cannot be used in an URL or a # HTTP "POST" request). If the desired output should be one # line, use the "-l" option. # # o The "-l" option assumes, that the end-of-line is denoted by # the character LF (ASCII 10). This is not true for Windows or # Mac systems, where the end of a line is denoted by the two # characters CR LF (ASCII 13 10). # We use this for symmetry; data processed in the following way: # cat | urlencode -l | urldecode -l # should (and will) result in the original data # # o Large lines (or binary files) will break many AWK # implementations. If you get the message # awk: record `...' too long # record number xxx # consider using GNU AWK (gawk). # # o urlencode will always terminate it's output with an EOL # character # # Thanks to Stefan Brozinski for pointing out a bug related to non-standard # locales. # # See also # urldecode ########################################################################## PN=`basename "$0"` # Program name VER='1.4' : ${AWK=awk} Usage () { echo >&2 "$PN - encode URL data, $VER usage: $PN [-l] [file ...] -l: encode line endings (result will be one line of output) The default is to encode each input line on its own." exit 1 } Msg () { for MsgLine do echo "$PN: $MsgLine" >&2 done } Fatal () { Msg "$@"; exit 1; } set -- `getopt hl "$@" 2>/dev/null` || Usage [ $# -lt 1 ] && Usage # "getopt" detected an error EncodeEOL=no while [ $# -gt 0 ] do case "$1" in -l) EncodeEOL=yes;; --) shift; break;; -h) Usage;; -*) Usage;; *) break;; # First file name esac shift done LANG=C export LANG $AWK ' BEGIN { # We assume an awk implementation that is just plain dumb. # We will convert an character to its ASCII value with the # table ord[], and produce two-digit hexadecimal output # without the printf("%02X") feature. EOL = "%0A" # "end of line" string (encoded) split ("1 2 3 4 5 6 7 8 9 A B C D E F", hextab, " ") hextab [0] = 0 for ( i=1; i<=255; ++i ) ord [ sprintf ("%c", i) "" ] = i + 0 if ("'"$EncodeEOL"'" == "yes") EncodeEOL = 1; else EncodeEOL = 0 } { encoded = "" for ( i=1; i<=length ($0); ++i ) { c = substr ($0, i, 1) if ( c ~ /[a-zA-Z0-9.-]/ ) { encoded = encoded c # safe character } else if ( c == " " ) { encoded = encoded "+" # special handling } else { # unsafe character, encode it as a two-digit hex-number lo = ord [c] % 16 hi = int (ord [c] / 16); encoded = encoded "%" hextab [hi] hextab [lo] } } if ( EncodeEOL ) { printf ("%s", encoded EOL) } else { print encoded } } END { #if ( EncodeEOL ) print "" } ' "$@"

chenzhiwei · Answer

これは最高のものかもしれません：

after=$(echo -e "$before" | od -An -tx1 | tr ' ' % | xargs printf "%s")

manoflinux · Answer

url=$(echo "$1" | sed -e 's/%/%25/g' -e 's/ /%20/g' -e 's/!/%21/g' -e 's/"/%22/g' -e 's/#/%23/g' -e 's/\$/%24/g' -e 's/\&/%26/g' -e 's/'\''/%27/g' -e 's/(/%28/g' -e 's/)/%29/g' -e 's/\*/%2a/g' -e 's/+/%2b/g' -e 's/,/%2c/g' -e 's/-/%2d/g' -e 's/\./%2e/g' -e 's///%2f/g' -e 's/:/%3a/g' -e 's/;/%3b/g' -e 's//%3e/g' -e 's/?/%3f/g' -e 's/@/%40/g' -e 's/$$/%5b/g' -e 's/\/%5c/g' -e 's/$$/%5d/g' -e 's/\^/%5e/g' -e 's/_/%5f/g' -e 's/`/%60/g' -e 's/{/%7b/g' -e 's/|/%7c/g' -e 's/}/%7d/g' -e 's/~/%7e/g')

これは文字列を$ 1の内側にエンコードして$ urlに出力します。あなたが望むならあなたはそれをvarに入れる必要はありませんが。ところでタブのためのsedを含まなかったそれはそれをスペースに変えるだろうと思った

davidchambers · Answer

これは、外部プログラムを呼び出さないBashソリューションです。

uriencode() { s="${1//'%'/%25}" s="${s//' '/%20}" s="${s//'"'/%22}" s="${s//'#'/%23}" s="${s//'$'/%24}" s="${s//'&'/%26}" s="${s//'+'/%2B}" s="${s//','/%2C}" s="${s//'/'/%2F}" s="${s//':'/%3A}" s="${s//';'/%3B}" s="${s//'='/%3D}" s="${s//'?'/%3F}" s="${s//'@'/%40}" s="${s//'['/%5B}" s="${s//']'/%5D}" printf %s "$s" }

Louis Marascio · Answer

Perlを必要としない解決策を探しているあなたのために、これはhexdumpとawkだけを必要とするものです：

url_encode() { [ $# -lt 1 ] && { return; } encodedurl="$1"; # make sure hexdump exists, if not, just give back the url [ ! -x "/usr/bin/hexdump" ] && { return; } encodedurl=` echo $encodedurl | hexdump -v -e '1/1 "%02x	"' -e '1/1 "%_c
"' | LANG=C awk ' $1 == "20" { printf("%s", "+"); next } # space becomes plus $1 ~ /0[adAD]/ { next } # strip newlines $2 ~ /^[a-zA-Z0-9.*()/-]$/ { printf("%s", $2); next } # pass through what we can { printf("%%%s", $1) } # take hex value of everything else '` }

ネット上のいくつかの場所といくつかのローカルの試行錯誤から一緒にステッチしました。それは素晴らしい作品です！

kev · Answer

ni2ascii はとても便利です：

$ echo -ne '你好世界' | uni2ascii -aJ %E4%BD%A0%E5%A5%BD%E4%B8%96%E7%95%8C

Klaus · Answer

あなたはJavaScriptでJavaScriptの encodeURIComponent をエミュレートすることができます。これがコマンドです：

Perl -pe 's/([^a-zA-Z0-9_.!~*()'\''-])/sprintf("%%%02X", ord($1))/ge'

これを.bash_profileのbashエイリアスとして設定できます。

alias encodeURIComponent='Perl -pe '\''s/([^a-zA-Z0-9_.!~*()'\''\'\'''\''-])/sprintf("%%%02X",ord($1))/ge'\'

これでencodeURIComponentにパイプ接続できます。

$ echo -n 'hèllo wôrld!' | encodeURIComponent h%C3%A8llo%20w%C3%B4rld!

Jay · Answer

Perlに依存したくない場合は、sedも使用できます。各文字を個別にエスケープする必要があるので、少し面倒です。以下の内容のファイルを作成し、urlencode.sedという名前で呼び出します。

s/%/%25/g s/ /%20/g s/ /%09/g s/!/%21/g s/"/%22/g s/#/%23/g s/\$/%24/g s/\&/%26/g s/'\''/%27/g s/(/%28/g s/)/%29/g s/\*/%2a/g s/+/%2b/g s/,/%2c/g s/-/%2d/g s/\./%2e/g s///%2f/g s/:/%3a/g s/;/%3b/g s//%3e/g s/?/%3f/g s/@/%40/g s/$$/%5b/g s/\/%5c/g s/$$/%5d/g s/\^/%5e/g s/_/%5f/g s/`/%60/g s/{/%7b/g s/|/%7c/g s/}/%7d/g s/~/%7e/g s/ /%09/g

使用するには、次のようにします。

STR1=$(echo "https://www.example.com/change&$ ^this to?%checkthe@-functionality" | cut -d\? -f1) STR2=$(echo "https://www.example.com/change&$ ^this to?%checkthe@-functionality" | cut -d\? -f2) OUT2=$(echo "$STR2" | sed -f urlencode.sed) echo "$STR1?$OUT2"

これは、文字列をエンコードが必要な部分と細かい部分に分割し、それを必要とする部分をエンコードしてから、再度ステッチします。

あなたは便宜上それをshスクリプトに入れることができます、多分それはエンコードするためのパラメータを取り、あなたのパスにそれを置くことができますそしてそれからあなたはただ呼ぶことができます：

urlencode https://www.exxample.com?isThisFun=HellNo

_出典

Darren Weber · Answer

シェルスクリプトからphpを使う：

value="http://www.google.com" encoded=$(php -r "echo rawurlencode('$value');") # encoded = "http%3A%2F%2Fwww.google.com" echo $(php -r "echo rawurldecode('$encoded');") # returns: "http://www.google.com"

Dylan · Answer

問題はbashでこれを行うことであり、実際にはあなたが望むものを正確に実行する単一のコマンド - "urlencode"があるので、pythonやPerlは必要ない。

value=$(urlencode "${2}")

たとえば、上記のPerlの回答ではすべての文字が正しくエンコードされていないため、これもはるかに優れています。あなたがWordから得た長いダッシュでそれを試してみて、あなたは間違ったエンコーディングを得ます。

このコマンドを実行するには、 "gridsite-clients"がインストールされている必要があります。

Ryan · Answer

単純なPHPオプション：

echo 'part-that-needs-encoding' | php -R 'echo urlencode($argn);'

davidchambers · Answer

これがノードのバージョンです。

uriencode() { node -p "encodeURIComponent('${1//\'/\\'}')" }

jan halfar · Answer

もう一つのphpアプローチ：

echo "encode me" | php -r "echo urlencode(file_get_contents('php://stdin'));"

k107 · Answer

完全を期すために、Ruby

value="$(Ruby -r cgi -e 'puts CGI.escape(ARGV[0])' "$2")"

nulleight · Answer

こちらが組み込みシステム用のbusybox ash Shellのバージョンです。私はもともとOrwellophileの亜種を採用しました。

urlencode() { local S="${1}" local encoded="" local ch local o for i in $(seq 0 $((${#S} - 1)) ) do ch=${S:$i:1} case "${ch}" in [-_.~a-zA-Z0-9]) o="${ch}" ;; *) o=$(printf '%%%02x' "'$ch") ;; esac encoded="${encoded}${o}" done echo ${encoded} } urldecode() { # urldecode <string> local url_encoded="${1//+/ }" printf '%b' "${url_encoded//%/\x}" }

Stuart P. Bentley · Answer

これはLuaを使った1行変換で、 blueyedの答えに似ていますが、すべての RFC 3986予約されていない文字未エンコードのままにします（この答えのように）：

url=$(echo 'print((arg[1]:gsub("([^%w%-%.%_%~])",function(c)return("%%%02X"):format(c:byte())end)))' | lua - "$1")

さらに、文字列内の改行がLFからCRLFに変換されるようにする必要があるかもしれません。その場合、パーセントエンコードの前にgsub(" ? ", " ")をチェーンに挿入できます。

これは、標準ではないapplication/x-www-form-urlencoded の形式で、改行の正規化とスペースのエンコードを組み合わせたものです。 '％20'の代わりに '+'とします（これはおそらく同様のテクニックを使ってPerlスニペットに追加できます）。

url=$(echo 'print((arg[1]:gsub("
?
", "
"):gsub("([^%w%-%.%_%~ ]))",function(c)return("%%%02X"):format(c:byte())end):gsub(" ","+"))' | lua - "$1")

Steven Penny · Answer

これを行うためのPOSIX関数は次のとおりです。

encodeURIComponent() { awk 'BEGIN {while (y++ < 125) z[sprintf("%c", y)] = y while (y = substr(ARGV[1], ++j, 1)) q = y ~ /[[:alnum:]_.!~*\47()-]/ ? q y : q sprintf("%%%02X", z[y]) print q}' "$1" }

例：

value=$(encodeURIComponent "$2")

出典

Ray Burgemeestre · Answer

これは、rawurlencodeおよびrawurldecode関数を含むorwellophileの回答のkshバージョンです（link： curlコマンドのデータをurlencodeするにはどうすればいいですか？）。コメントを投稿するのに十分な担当者がいないため、新しい投稿を作成します。

#!/bin/ksh93 function rawurlencode { typeset string="${1}" typeset strlen=${#string} typeset encoded="" for (( pos=0 ; pos<strlen ; pos++ )); do c=${string:$pos:1} case "$c" in [-_.~a-zA-Z0-9] ) o="${c}" ;; * ) o=$(printf '%%%02x' "'$c") esac encoded+="${o}" done print "${encoded}" } function rawurldecode { printf $(printf '%b' "${1//%/\x}") } print $(rawurlencode "C++") # --> C%2b%2b print $(rawurldecode "C%2b%2b") # --> C++

ajaest · Answer

Phpをインストールして、私はこのように使います：

URL_ENCODED_DATA=`php -r "echo urlencode('$DATA');"`

Nestor Urquiza · Answer

JavaScriptよりもURLの解析に優れているものは何ですか？

node -p "encodeURIComponent('$url')"

Per Bothner · Answer

以下はOrwellophileの答えに基づいていますが、LC_ALL = C（vte.shからのトリック）を設定することによってコメントで言及されているマルチバイトバグを解決します。それが私がそれを使う方法であるので、私はそれに適した関数Prompt_COMMANDの形でそれを書きました。

print_path_url() { local LC_ALL=C local string="$PWD" local strlen=${#string} local encoded="" local pos c o for (( pos=0 ; pos<strlen ; pos++ )); do c=${string:$pos:1} case "$c" in [-_.~a-zA-Z0-9/] ) o="${c}" ;; * ) printf -v o '%%%02x' "'$c" esac encoded+="${o}" done printf "\033]7;file://%s%s\007" "${HOSTNAME:-}" "${encoded}" }