Python 3でバイトを16進文字列に変換する正しい方法は何ですか?
bytes.hex
メソッド、bytes.decode
codecsのクレームを見て、 other 可能な限り最小限の驚きの機能を試しました。バイトを16進数にしたいだけです!
Python 3.5以降、これはついに厄介ではなくなりました。
>>> b'\xde\xad\xbe\xef'.hex()
'deadbeef'
そして逆:
>>> bytes.fromhex('deadbeef')
b'\xde\xad\xbe\xef'
可変bytearray
タイプでも機能します。
binascii
モジュールを使用します。
>>> import binascii
>>> binascii.hexlify('foo'.encode('utf8'))
b'666f6f'
>>> binascii.unhexlify(_).decode('utf8')
'foo'
この回答を参照してください: Python 3.1.1 string to hex
Pythonには、バイトからバイト 標準コーデック があり、quoted-printable(7ビットASCIIに適合)、base64(英数字に適合)、16進エスケープ、gzip、bz2圧縮などの便利な変換を実行します。 Python 2では、次のことができます。
b'foo'.encode('hex')
Python 3では、str.encode
/bytes.decode
はバイト<-> str変換専用です。代わりに、これを行うことができます。これは、Python 2とPython 3(s/encode/decode/gで機能します) ):
import codecs
codecs.getencoder('hex')(b'foo')[0]
Python 3.4以降では、それほど厄介ではないオプションがあります。
codecs.encode(b'foo', 'hex')
これらのその他のコーデックは、独自のモジュール(base64、zlib、bz2、uu、quopri、binascii)内でもアクセスできます。 APIの一貫性は劣りますが、圧縮コーデックの場合はより多くの制御が提供されます。
import codecs
codecs.getencoder('hex_codec')(b'foo')[0]
Python 3.3で動作します(「hex」ではなく「hex_codec」)。
メソッドbinascii.hexlify()
は、bytes
をASCII 16進文字列を表すbytes
に変換します。つまり、入力の各バイトは2つのASCII文字に変換されます。真のstr
出力が必要な場合は、結果を.decode("ascii")
できます。
それを示すスニペットを含めました。
import binascii
with open("addressbook.bin", "rb") as f: # or any binary file like '/bin/ls'
in_bytes = f.read()
print(in_bytes) # b'\n\x16\n\x04'
hex_bytes = binascii.hexlify(in_bytes)
print(hex_bytes) # b'0a160a04' which is twice as long as in_bytes
hex_str = hex_bytes.decode("ascii")
print(hex_str) # 0a160a04
16進数文字列"0a160a04"
からb'\n\x16\n\x04'
を返すbinascii.unhexlify("0a160a04")
でbytes
に戻ることができます
OK、次の答えはPython 3だけに関心がある場合、範囲をわずかに超えていますが、Pythonバージョンを指定しなくても、この質問は最初のGoogleヒットです。 Python 2 and Python 3.の両方で機能する方法を次に示します。
また、バイトをstr
型に変換することに関する質問を解釈しています。つまり、Python 2のbytes-yとPython 3のUnicode-yです。
それを考えると、私が知っている最良のアプローチは次のとおりです。
import six
bytes_to_hex_str = lambda b: ' '.join('%02x' % i for i in six.iterbytes(b))
次のアサーションは、Python 2またはPython 3のいずれかに当てはまります。Python 2でunicode_literals
futureをアクティブにしていないと仮定します。
assert bytes_to_hex_str(b'jkl') == '6a 6b 6c'
(または、''.join()
を使用して、バイト間のスペースなどを省略することができます。)
16進値をフォーマットして出力するフォーマット指定子%x02
を使用できます。例えば:
>>> foo = b"tC\xfc}\x05i\x8d\x86\x05\xa5\xb4\xd3]Vd\x9cZ\x92~'6"
>>> res = ""
>>> for b in foo:
... res += "%02x" % b
...
>>> print(res)
7443fc7d05698d8605a5b4d35d56649c5a927e2736