wget -S -O - http://google.com
によるwgetを使用して、ドキュメント本文とそのヘッダーを標準出力に出力しようとしています。
ただし、htmlドキュメントのみが表示されます。
ありがとう
UPD:
これを働いたwget --save-headers --output-document - http://google.com
wget --version
はGNU Wget 1.11.4 Red Hat変更を表示します
以下を試してください、余分なヘッダーはありません
wget -qO- www.google.com
末尾の-
に注意してください。これは、-O
がファイルに出力するための通常のコマンド引数の一部ですが、>
を使用してファイルに送信しないため、シェルに出力されます。 -qO-
または-qO -
を使用できます。
wget -S -O - http://google.com
は期待どおりに動作します。but警告付き:ヘッダーはデバッグ情報と見なされ、標準ではなく標準エラーに送信されます出力。標準出力をファイルまたは別のプロセスにリダイレクトする場合、ドキュメントのコンテンツのみを取得します。
可能な解決策として、標準エラーを標準出力にリダイレクトしてみてください。たとえば、bash
の場合:
$ wget -q -S -O - 2>&1 | grep ...
または
$ wget -q -S -O - 1>wget.txt 2>&1
-q
オプションは、wget
出力のプログレスバーやその他のいらいらする部分を抑制します。
ここで動作します:
$ wget -S -O - http://google.com
HTTP request sent, awaiting response...
HTTP/1.1 301 Moved Permanently
Location: http://www.google.com/
Content-Type: text/html; charset=UTF-8
Date: Sat, 25 Aug 2012 10:15:38 GMT
Expires: Mon, 24 Sep 2012 10:15:38 GMT
Cache-Control: public, max-age=2592000
Server: gws
Content-Length: 219
X-XSS-Protection: 1; mode=block
X-Frame-Options: SAMEORIGIN
Location: http://www.google.com/ [following]
--2012-08-25 12:20:29-- http://www.google.com/
Resolving www.google.com (www.google.com)... 173.194.69.99, 173.194.69.104, 173.194.69.106, ...
...skipped a few more redirections ...
[<=> ] 0 --.-K/s
<!doctype html><html itemscope="itemscope" itemtype="http://schema.org/WebPage"><head><meta itemprop="image" content="/images/google_favicon_128.png"><ti
... skipped ...
おそらく、wgetを更新する必要があります(~$ wget --version GNU Wget 1.14 built on linux-gnu.
)
これは機能しません:
wget -q -S -O - google.com 1>wget.txt 2>&1
リダイレクトは右から左に評価されるため、これによりhtmlがwget.txtに送信され、ヘッダーがSTDOUTに送信されます。
wget -q -S -O - google.com 2>&1 1>wget.txt
これはヘッダー付きの応答を印刷するために私のために働いた:
wget --server-response http://www.example.com/