Uriに名前が含まれていないときにWebClientを使用してダウンロードしたファイルの元の名前を知る方法はありますか?
これは、たとえばダウンロードが名前が事前にわからない動的ページから発生するサイトで発生します。
私のブラウザを使用すると、ファイルはorrect名を取得します。しかし、これはWebClientを使用してどのように実行できますか?例えば。
WebClient wc= new WebClient();
var data= wc.DownloadData(@"www.sometime.com\getfile?id=123");
このメソッドは事前にファイル名を必要とするため、DownloadFile()の使用は解決策ではありません。
応答ヘッダーを調べて、実際のファイル名を含むcontent-dispositionヘッダーが存在するかどうかを確認する必要があります。
WebClient wc = new WebClient();
var data= wc.DownloadData(@"www.sometime.com\getfile?id=123");
string fileName = "";
// Try to extract the filename from the Content-Disposition header
if (!String.IsNullOrEmpty(wc.ResponseHeaders["Content-Disposition"]))
{
fileName = wc.ResponseHeaders["Content-Disposition"].Substring(wc.ResponseHeaders["Content-Disposition"].IndexOf("filename=") + 9).Replace("\"", "");
}
応答ヘッダーを読む"Content-Disposition"
with WebClient.ResponseHeaders
そのはず:
Content-Disposition: attachment; filename="fname.ext"
コードは次のようになります。
string header = wc.ResponseHeaders["Content-Disposition"]??string.Empty;
const string filename="filename=";
int index = header.LastIndexOf(filename,StringComparison.OrdinalIgnoreCase);
if (index > -1)
{
fileName = header.Substring(index+filename.Length);
}
ファイルをダウンロードせずにファイル名を取得するには:
public string GetFilenameFromWebServer(string url)
{
string result = "";
var req = System.Net.WebRequest.Create(url);
req.Method = "HEAD";
using (System.Net.WebResponse resp = req.GetResponse())
{
// Try to extract the filename from the Content-Disposition header
if (!string.IsNullOrEmpty(resp.Headers["Content-Disposition"]))
{
result = resp.Headers["Content-Disposition"].Substring(resp.Headers["Content-Disposition"].IndexOf("filename=") + 9).Replace("\"", "");
}
}
return result;
}
私のように、正しくフォーマットされていないか、何らかの理由でContentDispositionクラスによって自動的に解析できないContent-Dispositionヘッダーを処理する必要がある場合は、次の解決策があります。
string fileName = null;
// Getting file name
var request = WebRequest.Create(url);
request.Method = "HEAD";
using (var response = request.GetResponse())
{
// Headers are not correct... So we need to parse manually
var contentDisposition = response.Headers["Content-Disposition"];
// We delete everything up to and including 'Filename="'
var fileNameMarker= "filename=\"";
var beginIndex = contentDisposition.ToLower().IndexOf(fileNameMarker);
contentDisposition = contentDisposition.Substring(beginIndex + fileNameMarker.Length);
//We only get the string until the next double quote
var fileNameLength = contentDisposition.ToLower().IndexOf("\"");
fileName = contentDisposition.Substring(0, fileNameLength);
}