web-dev-qa-db-ja.com

クリップボードのUnicode文字は何ですか?

任意の文字のUnicodeコードポイントを見つけるための迅速で簡単な方法はありますか?たとえば、Webページ、PDFファイル、またはその他の文書に変な文字が表示されています。

私が現在していることは、その文字をクリップボードにコピーし、それをファイルに保存し、そしてそのファイルを16進ビューアで見ることです。あるいは、Microsoft Wordを開き、貼り付けてAlt + Xを押すこともできます。これらの方法はどちらも少し面倒です。もっと簡単な方法はありますか?

私はNotepad ++を使用していますので、Notepad ++でそれを実行する方法がある場合は、それが適切な答えになります(Wordを開く必要があるよりも面倒ではありません)。それとも、小さな特殊なアプリケーションでそれを行う方法はありますか?

50

私はUnicode文字を扱うことが多いので、このために小さなWindowsアプリケーションを作成しました。

Unicode Character Informerドキュメント

さらに、私のテキストエディタ、 Rejbrandテキストエディタ は、広範囲のUnicode文字をサポートしています。

31

Notepad ++には、Converterという プラグイン があり、ASCIIをHEXに、またはその逆に変換することができます。このツールは、読むためにASCIIに変換されるHEXフォーマットのデータファイルを変換するのに非常に便利です。

enter image description here

それがどのように機能するのかです。

enter image description here

33
duDE

この問題に直面したときは、通常、Googleで簡単に検索するとすぐに回答が得られます。たとえば、 "???? unicode"をグーグルすると、このような結果になります。 Google search for the "smiling face with heart shaped eyes" emoji

私はこの方法が好きです:

  • それはインターネットを持つすべてのコンピュータで動作します
  • 何もインストールする必要はありません
  • 必要なキープレス(Ctrl+C & Ctrl+T & Ctrl+V & Enter私にとって、そしておそらく他のほとんどの開発者/タイピストにとっての筋記憶作用です。
17
Eric Seastrand

Unix系システムでは*:

unicode -s "$(xsel -ob)"

これをエイリアスするか、実行するスクリプトを作成することができます。

出力は次のようになります。

U+2672 UNIVERSAL RECYCLING SYMBOL
UTF-8: e2 99 b2 UTF-16BE: 2672 Decimal: ♲ Octal: \023162
♲ (♲)
Uppercase: 2672
Category: So (Symbol, Other)
Bidi: ON (Other Neutrals)

*元のポスターはおそらくWindowsを使っているようですが、(a)これは指定されていません。

9
wchargin

Unicode Character Inspector (Tim Whitlockによって構築された)と呼ばれる素敵な小さなWebサイトがあります。テキストエディタやデスクトッププログラムよりもずっと便利だと思います。

8

あなたはPowerShellを使うことができます!

[char]::ConvertToUtf32((gcb), 0)

これは、クリップボードのテキストの最初のUnicodeコードポイントを印刷します。

もしあなたがBasic Multilingual Planeの外側の文字(それが.NETの文字列では高位と低位の代理として表されるだろう)について心配する必要がないならば、代わりにこれを使うことができる:

[int](gcb)[0]

16進数で使用する場合は、 フォーマット指定子 を使用できます。

'0x{0:x}' -f [char]::ConvertToUtf32((gcb), 0)
6
Ben N

Emacsをお使いの方への注意:C-u C-x =と入力すると、カーソル位置の文字に関する情報(Unicodeコードポイント、Unicodeデータベース内の名前、カテゴリなど)が表示されます。

             position: 146 of 147 (99%), column: 0
            character: ♲ (displayed as ♲) (codepoint 9842, #o23162, #x2672)
    preferred charset: unicode (Unicode (ISO10646))
code point in charset: 0x2672
               script: symbol
               syntax: w    which means: Word
             category: .:Base
             to input: type "C-x 8 RET 2672" or "C-x 8 RET UNIVERSAL RECYCLING SYMBOL"
          buffer code: #xE2 #x99 #xB2
            file code: #xE2 #x99 #xB2 (encoded by coding system utf-8-unix)
              display: by this font (glyph code)
    xft:-PfEd-Mensch-normal-normal-normal-*-16-*-*-*-m-0-iso10646-1 (#x985)

Character code properties: customize what to show
  name: UNIVERSAL RECYCLING SYMBOL
  general-category: So (Symbol, Other)
  decomposition: (9842) ('♲')
5
Neil Roberts

Vimを手に入れた?貼り付けて、カーソルを合わせてgaを押すだけです。私はこれをいつも変なキャラクターに使っています。

3
SilverWolf

私は http://unicode.scarfboy.com を使用します。これは単純で、うまく機能します。

私はRishard Ishidaの Unicodeコードコンバータ(githubリンク) が、とりわけUnicode文字コードを見つけるのにとても便利だと思います。それはまた、他のコードポイント、エンコーディング、そして例えばエスケープシーケンスへの変換/変換を提供します。

Unicode Converter

あなたがRichard Ishidaの メインウェブページ(rishida.net) をチェックアウトしたいと思うかもしれません。国際化と文字エンコーディングに興味があります。たとえば、そこにリンクされているもう1つの非常に便利なツールは、彼の Univiewツール(githubリンク) です。

Uniview

そして最後に、Macユーザーに最も関連があるが、Input MenからアクセスできるmacOSの Character Viewer も非常に便利です。これはシステム環境設定Keyboardで有効にできます。

AppleサポートWebサイト は主に絵文字の挿入方法(…)に焦点を当てていますが、Character Viewerは実際には特定の検索に非常に便利です( 'いくつかの異なるエンコーディングの特殊な ')文字とそのコードポイント、およびあなたのシステム上のどのフォントが特定のグリフを含んでいるかを見つけるため。

Character Viewer

乾杯!

2
arri

次のサイトも使用できます。 https://unicode-table.com/en/ 文字を貼り付けるだけで、Unicodeが表示されます。コードポイントとHTMLコードも同様です。

2
Alina Ladygina

Microsoft Wordをお持ちの場合は、そこにテキストを貼り付け、文字を選択して(またはその右側をクリックして)押します。 Alt+X

1
G-Man

User202729のアイデアを使用したもう1つの回答があります。

URL javascript:alert(Prompt().codePointAt(0).toString(16))をブックマークしてブラウザで実行してください。 (ChromeとFirefoxでは動作します。IEでは動作しないようですが、これはセキュリティ設定が原因である可能性があります。)

他の答えとは異なり、インターネットに接続する必要はなく、ダウンロードする外部ユーティリティもなく、OS固有のものもありません。

0

クイック検索フィールドでは本当に使いやすく、さまざまな表記をサポートしているので、 http://amp-what.com/ を言及します。 &code、Unicodeコードポイント、URIエンコード文字シーケンス).

サンプル画像

0
493msi