web-dev-qa-db-ja.com

テキストファイル内の特殊文字(顔文字)

WhatsAppからエクスポートされた会話のtxtファイルがあります。 WhatsAppは会話で絵文字をサポートしており、エクスポートされた会話にも驚いたことにこれらの絵文字が含まれています!つまり、テキストエディター(Mac 10.8のText Wrangler)でテキストファイルを開くと、絵文字が表示されます。テキストファイルはUTF-8でエンコードされており、ファイルに関連付けられているリソースを確認できません。

これらの絵文字がテキストファイルにどのように含まれ、テキストエディターによってどのように正確に解釈されているかを誰かに説明できますか?これは文字エンコーディングに関係していますか?テキストファイルに追加のリソースが含まれていますか?

17
Sean Connolly

Unicodeには、絵文字を「文字」として指定するセクションが含まれています。それらは通常の文字であり、それらを表示できるフォントだけが必要です。 nicode Emoji FAQ もご覧ください。

テキストファイルでは、文字は基本的にバイト形式の数値としてエンコードされます。それらをコンピュータ画面に視覚的に表示するには、この文字をレンダリングする視覚的なglyphを含むfontが必要です。プロセスは常に数値識別子→フォント→表示グリフであるため、「文字」は絵文字やその他の画像を含め、視覚的なものであれば何でもかまいません。

character viewer

25
deceze