Nodejs request module を使用して別のページにリダイレクトするURLをフォローしようとしています。
ドキュメントを調べてみると、リダイレクト後にURLを取得できるものが見つかりませんでした。
私のコードは次のとおりです。
var request = require("request"),
options = {
uri: 'http://www.someredirect.com/somepage.asp',
timeout: 2000,
followAllRedirects: true
};
request( options, function(error, response, body) {
console.log( response );
});
リダイレクトチェーンの最後のURLを取得する2つの非常に簡単な方法があります。
var r = request(url, function (e, response) {
r.uri
response.request.uri
})
Uriはオブジェクトです。 uri.hrefには、クエリパラメータを含むURLが文字列として含まれています。
このコードは、リクエストの作成者によるgithubの問題に関するコメントに基づいています。 https://github.com/mikeal/request/pull/220#issuecomment-5012579
例:
var request = require('request');
var r = request.get('http://google.com?q=foo', function (err, res, body) {
console.log(r.uri.href);
console.log(res.request.uri.href);
// Mikael doesn't mention getting the uri using 'this' so maybe it's best to avoid it
// please add a comment if you know why this might be bad
console.log(this.uri.href);
});
これは http://www.google.com/?q=foo を3回出力します(ないアドレスからwwwのあるアドレスにリダイレクトされたことに注意してください)。
リダイレクトURLを見つけるには、これを試してください:
var url = 'http://www.google.com';
request({ url: url, followRedirect: false }, function (err, res, body) {
console.log(res.headers.location);
});
request
はデフォルトでリダイレクトを取得しますが、デフォルトでは10回のリダイレクトを取得できます。これは docs で確認できます。これの欠点は、デフォルトのオプションで、取得したURLがリダイレクトされたURLか元のURLかを知らないことです。
例えば:
request('http://www.google.com', function (error, response, body) {
console.log(response.headers)
console.log(body) // Print the google web page.
})
出力を与える
> { date: 'Wed, 22 May 2013 15:11:58 GMT',
expires: '-1',
'cache-control': 'private, max-age=0',
'content-type': 'text/html; charset=ISO-8859-1',
server: 'gws',
'x-xss-protection': '1; mode=block',
'x-frame-options': 'SAMEORIGIN',
'transfer-encoding': 'chunked' }
ただし、オプションfollowRedirect
をfalseとして指定した場合
request({url:'http://www.google.com',followRedirect :false}, function (error, response, body) {
console.log(response.headers)
console.log(body)
});
それは与えます
> { location: 'http://www.google.co.in/',
'cache-control': 'private',
'content-type': 'text/html; charset=UTF-8',
date: 'Wed, 22 May 2013 15:12:27 GMT',
server: 'gws',
'content-length': '221',
'x-xss-protection': '1; mode=block',
'x-frame-options': 'SAMEORIGIN' }
<HTML><HEAD><meta http-equiv="content-type" content="text/html;charset=utf-8">
<TITLE>302 Moved</TITLE></HEAD><BODY>
<H1>302 Moved</H1>
The document has moved
<A HREF="http://www.google.co.in/">here</A>.
</BODY></HTML>
そのため、リダイレクトされたコンテンツを取得する心配はありません。ただし、リダイレクトされているかどうかを知りたい場合は、followRedirect
falseを設定し、応答のlocation
ヘッダーを確認してください。
次のように、followRedirect
の関数形式(followAllRedirects
ではなく)を使用できます。
options.followRedirect = function(response) {
var url = require('url');
var from = response.request.href;
var to = url.resolve(response.headers.location, response.request.href);
return true;
};
request(options, function(error, response, body) {
// normal code
});