web-dev-qa-db-ja.com

文字列値の前にある「u」記号の意味は何ですか?

はい、要するに、私は自分のキーと値の前にuが見える理由を知りたいです。

フォームをレンダリングしています。フォームには、特定のラベル用のチェックボックスと、IPアドレス用の1つのテキストフィールドがあります。 list_keyにハードコーディングされたキーがラベルであるディクショナリを作成しています。ディクショナリの値はフォーム入力(list_value)から取得されます。辞書は作成されますが、一部の値についてはuが前に付きます。辞書のサンプル出力は次のとおりです。

{u'1': {'broadcast': u'on', 'arp': '', 'webserver': '', 'ipaddr': u'', 'dns': ''}}

誰かが私が間違っていることを説明してください。 pyscripterで同様の方法をシミュレートすると、エラーが発生しません。コードを改善するための提案を歓迎します。ありがとうございました

#!/usr/bin/env python

import webapp2
import itertools
import cgi

form ="""
    <form method="post">
    FIREWALL 
    <br><br>
    <select name="profiles">
        <option value="1">profile 1</option>
        <option value="2">profile 2</option>
        <option value="3">profile 3</option>
    </select>
    <br><br>
    Check the box to implement the particular policy
    <br><br>

    <label> Allow Broadcast
        <input type="checkbox" name="broadcast">
    </label>
    <br><br>

    <label> Allow ARP
        <input type="checkbox" name="arp">
    </label><br><br>

    <label> Allow Web traffic from external address to internal webserver
        <input type="checkbox" name="webserver">
    </label><br><br>

    <label> Allow DNS
        <input type="checkbox" name="dns">
    </label><br><br>

    <label> Block particular Internet Protocol  address
        <input type="text" name="ipaddr">
    </label><br><br>

    <input type="submit">   
    </form>
"""
dictionarymain={}

class MainHandler(webapp2.RequestHandler):  
    def get(self):
        self.response.out.write(form)

    def post(self):
        # get the parameters from the form 
        profile = self.request.get('profiles')

        broadcast = self.request.get('broadcast')
        arp = self.request.get('arp')
        webserver = self.request.get('webserver')
        dns =self.request.get('dns')
        ipaddr = self.request.get('ipaddr')


        # Create a dictionary for the above parameters
        list_value =[ broadcast , arp , webserver , dns, ipaddr ]
        list_key =['broadcast' , 'arp' , 'webserver' , 'dns' , 'ipaddr' ]

        #self.response.headers['Content-Type'] ='text/plain'
        #self.response.out.write(profile)

        # map two list to a dictionary using itertools
        adict = dict(Zip(list_key,list_value))
        self.response.headers['Content-Type'] ='text/plain'
        self.response.out.write(adict)

        if profile not in dictionarymain:
            dictionarymain[profile]= {}
        dictionarymain[profile]= adict

        #self.response.headers['Content-Type'] ='text/plain'
        #self.response.out.write(dictionarymain)

        def escape_html(s):
            return cgi.escape(s, quote =True)



app = webapp2.WSGIApplication([('/', MainHandler)],
                              debug=True)
111
user1488987

文字列値の前の「u」は、文字列がユニコードとして表されていることを意味します。ここでの文字列の前の文字は、「文字列エンコーディング宣言」と呼ばれます。 Unicodeは、通常のASCIIが管理できる以上の文字を表現する方法です。

文字列を複数の方法でUnicodeに変換できます。

>>> u'foo'
u'foo'
>>> unicode('foo')
u'foo'

しかし、本当の理由は、このようなものを表すことです( translation here ):

>>> val = u'Ознакомьтесь с документацией'
>>> val
u'\u041e\u0437\u043d\u0430\u043a\u043e\u043c\u044c\u0442\u0435\u0441\u044c \u0441 \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u0435\u0439'
>>> print val
Ознакомьтесь с документацией

ほとんどの場合、このコードのASCII文字列とは異なる方法でエラーを処理する必要はありません。

文字列に特殊文字を解釈しないように指示する「生」記号など、他の記号も表示されます。これは、Pythonで正規表現を行うときに非常に便利です。

>>> 'foo\"'
'foo"'
>>> r'foo\"'
'foo\\"'

ASCII文字列とUnicode文字列は論理的に同等です。

>>> bird1 = unicode('unladen swallow')
>>> bird2 = 'unladen swallow'
>>> bird1 == bird2
True
156
jdi

これは機能であり、バグではありません。

http://docs.python.org/howto/unicode.html 、特に「unicode type」セクションを参照してください。

11
Sean W