web-dev-qa-db-ja.com

Python stringからゼロ幅スペースのUnicode文字を削除

Pythonこのような文字列があります:

u'\u200cHealth & Fitness'

どうすれば削除できますか

\u200c

文字列の一部?

13
V.Anh

asciiにエンコードしてエラーを無視できます:

u'\u200cHealth & Fitness'.encode('ascii', 'ignore')

出力:

'Health & Fitness'
33
Arount

Unicode文字を含む文字列がある場合、

s = "Airports Council International \u2013 North America"

次に試すことができます:

newString = (s.encode('ascii', 'ignore')).decode("utf-8")

出力は次のようになります。

Airports Council International North America

ヘルプがあれば投票 :)

17
Hayat

私はそれを必要としないので、単にreplaceを使用します。

varstring.replace('\u200c', '')

またはあなたの場合:

u'\u200cHealth & Fitness'.replace('\u200c', '')

私にとっては、以下が働いた

mystring.encode('ascii', 'ignore').decode('unicode_escape')
1
Diana