任意の文字のUnicodeコードポイントを見つけるための迅速で簡単な方法はありますか?たとえば、Webページ、PDFファイル、またはその他の文書に変な文字が表示されています。
私が現在していることは、その文字をクリップボードにコピーし、それをファイルに保存し、そしてそのファイルを16進ビューアで見ることです。あるいは、Microsoft Wordを開き、貼り付けてAlt + Xを押すこともできます。これらの方法はどちらも少し面倒です。もっと簡単な方法はありますか?
私はNotepad ++を使用していますので、Notepad ++でそれを実行する方法がある場合は、それが適切な答えになります(Wordを開く必要があるよりも面倒ではありません)。それとも、小さな特殊なアプリケーションでそれを行う方法はありますか?
私はUnicode文字を扱うことが多いので、このために小さなWindowsアプリケーションを作成しました。
Unicode Character Informer ( ドキュメント )
さらに、私のテキストエディタ、 Rejbrandテキストエディタ は、広範囲のUnicode文字をサポートしています。
Notepad ++には、Converterという プラグイン があり、ASCIIをHEXに、またはその逆に変換することができます。このツールは、読むためにASCIIに変換されるHEXフォーマットのデータファイルを変換するのに非常に便利です。
それがどのように機能するのかです。
Unix系システムでは*:
unicode -s "$(xsel -ob)"
これをエイリアスするか、実行するスクリプトを作成することができます。
出力は次のようになります。
U+2672 UNIVERSAL RECYCLING SYMBOL
UTF-8: e2 99 b2 UTF-16BE: 2672 Decimal: ♲ Octal: \023162
♲ (♲)
Uppercase: 2672
Category: So (Symbol, Other)
Bidi: ON (Other Neutrals)
*元のポスターはおそらくWindowsを使っているようですが、(a)これは指定されていません。
Unicode Character Inspector (Tim Whitlockによって構築された)と呼ばれる素敵な小さなWebサイトがあります。テキストエディタやデスクトッププログラムよりもずっと便利だと思います。
あなたはPowerShellを使うことができます!
[char]::ConvertToUtf32((gcb), 0)
これは、クリップボードのテキストの最初のUnicodeコードポイントを印刷します。
もしあなたがBasic Multilingual Planeの外側の文字(それが.NETの文字列では高位と低位の代理として表されるだろう)について心配する必要がないならば、代わりにこれを使うことができる:
[int](gcb)[0]
16進数で使用する場合は、 フォーマット指定子 を使用できます。
'0x{0:x}' -f [char]::ConvertToUtf32((gcb), 0)
Emacsをお使いの方への注意:C-u C-x =
と入力すると、カーソル位置の文字に関する情報(Unicodeコードポイント、Unicodeデータベース内の名前、カテゴリなど)が表示されます。
position: 146 of 147 (99%), column: 0
character: ♲ (displayed as ♲) (codepoint 9842, #o23162, #x2672)
preferred charset: unicode (Unicode (ISO10646))
code point in charset: 0x2672
script: symbol
syntax: w which means: Word
category: .:Base
to input: type "C-x 8 RET 2672" or "C-x 8 RET UNIVERSAL RECYCLING SYMBOL"
buffer code: #xE2 #x99 #xB2
file code: #xE2 #x99 #xB2 (encoded by coding system utf-8-unix)
display: by this font (glyph code)
xft:-PfEd-Mensch-normal-normal-normal-*-16-*-*-*-m-0-iso10646-1 (#x985)
Character code properties: customize what to show
name: UNIVERSAL RECYCLING SYMBOL
general-category: So (Symbol, Other)
decomposition: (9842) ('♲')
Vimを手に入れた?貼り付けて、カーソルを合わせてga
を押すだけです。私はこれをいつも変なキャラクターに使っています。
私は http://unicode.scarfboy.com を使用します。これは単純で、うまく機能します。
私はRishard Ishidaの Unicodeコードコンバータ(githubリンク) が、とりわけUnicode文字コードを見つけるのにとても便利だと思います。それはまた、他のコードポイント、エンコーディング、そして例えばエスケープシーケンスへの変換/変換を提供します。
あなたがRichard Ishidaの メインウェブページ(rishida.net) をチェックアウトしたいと思うかもしれません。国際化と文字エンコーディングに興味があります。たとえば、そこにリンクされているもう1つの非常に便利なツールは、彼の Univiewツール(githubリンク) です。
そして最後に、Macユーザーに最も関連があるが、Input MenからアクセスできるmacOSの Character Viewer も非常に便利です。これはシステム環境設定→Keyboardで有効にできます。
AppleサポートWebサイト は主に絵文字の挿入方法(…)に焦点を当てていますが、Character Viewerは実際には特定の検索に非常に便利です( 'いくつかの異なるエンコーディングの特殊な ')文字とそのコードポイント、およびあなたのシステム上のどのフォントが特定のグリフを含んでいるかを見つけるため。
乾杯!
次のサイトも使用できます。 https://unicode-table.com/en/ 文字を貼り付けるだけで、Unicodeが表示されます。コードポイントとHTMLコードも同様です。
Microsoft Wordをお持ちの場合は、そこにテキストを貼り付け、文字を選択して(またはその右側をクリックして)押します。 Alt+X。
User202729のアイデアを使用したもう1つの回答があります。
URL javascript:alert(Prompt().codePointAt(0).toString(16))
をブックマークしてブラウザで実行してください。 (ChromeとFirefoxでは動作します。IEでは動作しないようですが、これはセキュリティ設定が原因である可能性があります。)
他の答えとは異なり、インターネットに接続する必要はなく、ダウンロードする外部ユーティリティもなく、OS固有のものもありません。
クイック検索フィールドでは本当に使いやすく、さまざまな表記をサポートしているので、 http://amp-what.com/ を言及します。 &code、Unicodeコードポイント、URIエンコード文字シーケンス).
サンプル画像