Gzip形式ファイル(たとえば、gzip
プログラムで作成)は、「deflate」圧縮アルゴリズムを使用します。これは、 zlib が使用するものと同じ圧縮アルゴリズムです。ただし、zlibを使用してgzip圧縮ファイルをインフレートすると、ライブラリはZ_DATA_ERROR
。
Zlibを使用してgzipファイルを解凍するにはどうすればよいですか?
Zlibでgzip形式のファイルを解凍するには、次のようにinflateInit2
としてwindowBits
パラメーターを指定して16+MAX_WBITS
を呼び出します。
inflateInit2(&stream, 16+MAX_WBITS);
これを行わない場合、zlibは不適切なストリーム形式について文句を言います。デフォルトでは、zlibはzlibヘッダーを持つストリームを作成します。指定しない限り、inflateでは異なるgzipヘッダーを認識しません。これはzlib.h
ヘッダーファイルのバージョン1.2.1以降で文書化されていますが、 zlibマニュアル には含まれていません。ヘッダーファイルから:
windowBits
は、オプションのgzipデコードの場合、15より大きくすることもできます。windowBits
に32を追加して自動ヘッダー検出を使用してzlibおよびgzipデコードを有効にするか、16を追加してgzip形式のみをデコードします(zlib形式はZ_DATA_ERROR
を返します)。 gzipストリームがデコードされている場合、strm->adler
はadler32ではなくcrc32です。
python zlib
モジュールもこれらをサポートします。
ただし、zlib
はこれらすべての形式を解凍できます。
deflate
形式に(圧縮解除)圧縮するには、wbits = -zlib.MAX_WBITS
を使用しますzlib
形式に(圧縮解除)圧縮するには、wbits = zlib.MAX_WBITS
を使用しますgzip
形式に(圧縮解除)圧縮するには、wbits = zlib.MAX_WBITS | 16
を使用しますhttp://www.zlib.net/manual.html#Advanced のドキュメントを参照してください(セクションinflateInit2
)
テストデータ:
>>> deflate_compress = zlib.compressobj(9, zlib.DEFLATED, -zlib.MAX_WBITS)
>>> zlib_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS)
>>> gzip_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS | 16)
>>>
>>> text = '''test'''
>>> deflate_data = deflate_compress.compress(text) + deflate_compress.flush()
>>> zlib_data = zlib_compress.compress(text) + zlib_compress.flush()
>>> gzip_data = gzip_compress.compress(text) + gzip_compress.flush()
>>>
zlib
の明らかなテスト:
>>> zlib.decompress(zlib_data)
'test'
deflate
のテスト:
>>> zlib.decompress(deflate_data)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(deflate_data, -zlib.MAX_WBITS)
'test'
gzip
のテスト:
>>> zlib.decompress(gzip_data)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|16)
'test'
データはgzip
モジュールとも互換性があります:
>>> import gzip
>>> import StringIO
>>> fio = StringIO.StringIO(gzip_data)
>>> f = gzip.GzipFile(fileobj=fio)
>>> f.read()
'test'
>>> f.close()
32
をwindowBits
に追加すると、ヘッダー検出がトリガーされます
>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|32)
'test'
>>> zlib.decompress(zlib_data, zlib.MAX_WBITS|32)
'test'
gzip
を使用Gzipヘッダーを持つgzip
データの場合、gzip
モジュールを直接使用できます。しかし フードの下で 、gzip
はzlib
を使用することに注意してください。
fh = gzip.open('abc.gz', 'rb')
cdata = fh.read()
fh.close()