私はこの文字列を持っています:Hello world !!
そして私は48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21
としてPythonを使ってそれを印刷したいです。
hex()
は整数に対してのみ機能します。
どうすればそれができますか?
あなたはあなたの文字列をint型ジェネレータに変換し、各要素に16進フォーマットを適用し、そしてセパレータでインターカレートすることができます。
>>> s = "Hello world !!"
>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21
':'.join(x.encode('hex') for x in 'Hello World!')
Python 2.xの場合:
':'.join(x.encode('hex') for x in 'Hello World!')
上記のコードはPython 3.xでは機能しません。3.xでは、以下のコードが機能します。
':'.join(hex(ord(x))[2:] for x in 'Hello World!')
2行に1つの答えがありますが、これは読みやすく、文字列内の改行やその他の奇数文字をデバッグするのに役立ちます。
for character in string:
print character, character.encode('hex')
Fedor Gogolevの答えに対するいくつかの補足:
まず、文字列に 'ASCII code'が10未満の文字が含まれていると、必要に応じて表示されません。その場合、正しいフォーマットは{:02x}
です。
>>> s = "Hello unicode \u0005 !!"
>>> ":".join("{0:x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:5:20:21:21'
^
>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:05:20:21:21'
^^
第二に、あなたの "文字列"が実際には "バイト文字列"であるなら - そして違いはPython 3で問題になるので - あなたは以下を好むかもしれません:
>>> s = b"Hello bytes \x05 !!"
>>> ":".join("{:02x}".format(c) for c in s)
'48:65:6c:6c:6f:20:62:79:74:65:73:20:05:20:21:21'
上記のコードでは、 bytesオブジェクトは"不変シーケンスとして定義されている ように変換する必要はありません。 0 <= x <256 "の範囲の整数の数.
文字列を16進バイトとして表示しますか?
受け入れられた答えは与えます:
s = "Hello world !!"
":".join("{:02x}".format(ord(c)) for c in s)
以下を返します。
'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21'
受け入れられた答えはあなたがバイト(ほとんどがアスキー文字)を使う限りだけうまくいく。しかし、あなたがユニコードを使うならば、例えば:
a_string = u"Привет мир!!" # "Prevyet mir", or "Hello World" in Russian.
どういうわけかバイトに変換する必要があります。
端末がこれらの文字を受け付けない場合は、UTF-8からデコードするか名前を使用することができます(したがって、私と一緒にコードを貼り付けて実行できます)。
a_string = (
"\N{CYRILLIC CAPITAL LETTER PE}"
"\N{CYRILLIC SMALL LETTER ER}"
"\N{CYRILLIC SMALL LETTER I}"
"\N{CYRILLIC SMALL LETTER VE}"
"\N{CYRILLIC SMALL LETTER IE}"
"\N{CYRILLIC SMALL LETTER TE}"
"\N{SPACE}"
"\N{CYRILLIC SMALL LETTER EM}"
"\N{CYRILLIC SMALL LETTER I}"
"\N{CYRILLIC SMALL LETTER ER}"
"\N{EXCLAMATION MARK}"
"\N{EXCLAMATION MARK}"
)
だから我々はそれを見ます:
":".join("{:02x}".format(ord(c)) for c in a_string)
戻る
'41f:440:438:432:435:442:20:43c:438:440:21:21'
悪い/思いがけない結果 - これらは書記素を作るために組み合わさるコードポイントです。世界中。これはnotですが、この情報は実際にどのように格納されているのでしょうか。
別のソースがこのデータを使用できるようにするには、通常、UTF-8エンコーディングに変換する必要があります。たとえば、この文字列をバイト単位でディスクに保存したり、htmlに公開したりします。そのため、コードポイントをUTF-8のコード単位に変換するためのエンコーディングが必要です。Python3では、ord
は整数の反復可能であるため、bytes
は必要ありません。
>>> ":".join("{:02x}".format(c) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
あるいはもっと洗練された方法で、新しいf-stringsを使うこと(Python 3でのみ利用可能):
>>> ":".join(f'{c:02x}' for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
Python 2では、最初にc
をord
に渡します。すなわちord(c)
- その他の例:
>>> ":".join("{:02x}".format(ord(c)) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
>>> ":".join(format(ord(c), '02x') for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
あなたは hexdump
を使うことができます
import hexdump
hexdump.dump("Hello World", sep=":")
(小文字が必要な場合は.lower()
を追加してください)。これはPython 2と3の両方で機能します。
Mapおよびlambda関数を使用すると、16進値のリストを作成でき、それを印刷することができます(または他の目的に使用することができます)。
>>> s = 'Hello 1 2 3 \x01\x02\x03 :)'
>>> map(lambda c: hex(ord(c)), s)
['0x48', '0x65', '0x6c', '0x6c', '0x6f', '0x20', '0x31', '0x20', '0x32', '0x20', '0x33', '0x20', '0x1', '0x2', '0x3', '0x20', '0x3a', '0x29']
これは以下の方法で行うことができます。
from __future__ import print_function
str = "Hello World !!"
for char in str:
mm = int(char.encode('hex'), 16)
print(hex(mm), sep=':', end=' ' )
この出力は次のように16進数になります。
0x48 0x65 0x6c 0x6c 0x6f 0x20 0x57 0x6f 0x72 0x6c 0x64 0x20 0x21 0x21
Python 3では:
":".join(c.encode().hex() for c in "Hello world !!")
# 48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21
これは@ Aestheteの答えに似ています。
利便性のために、非常に単純です。
def hexlify_byteString(byteString, delim="%"):
''' very simple way to hexlify a bytestring using delimiters '''
retval = ""
for intval in byteString:
retval += ( '0123456789ABCDEF'[int(intval / 16)])
retval += ( '0123456789ABCDEF'[int(intval % 16)])
retval += delim
return( retval[:-1])
hexlify_byteString(b'Hello World!', ":")
# Out[439]: '48:65:6C:6C:6F:20:57:6F:72:6C:64:21'
python2でのbase64.b16encode
の使用(組み込み)
>>> s = 'Hello world !!'
>>> h = base64.b16encode(s)
>>> ':'.join([h[i:i+2] for i in xrange(0, len(h), 2)]
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'