web-dev-qa-db-ja.com

pythonユニコード文字列サイズを取得

バイナリファイルがあります。このファイルにはUTF-8文字列が含まれています。さらに、この文字列は1つの単語であることが保証されています。 Pythonで、この文字列の文字数を取得するにはどうすればよいですか?

たとえば、このファイルを開いてバイトを読み取ったとします。

bytes = open("1.dat", "rb").read()

UTF-8文字列の長さ(バイトではなく文字)を調べるには、次に何をする必要がありますか?

18
Nick
unicode_string = bytes.decode("utf-8")
print len(unicode_string)
34
Håvard