web-dev-qa-db-ja.com

正規表現とメモ帳++ですべての非ASCII文字を削除する方法

私はよく検索しましたが、Notepad ++からASCII以外の文字を削除する方法が書かれているところはありません。

どのコマンドを書くのかを見つけて置き換える必要があります(写真では素晴らしいでしょう)。

  • ホワイトリストを作成し、すべてのASCII単語/行をブックマークしてASCII以外の行にマークを付けないようにする場合

  • ファイルが非常に大きく、すべてのASCII行を選択できず、ASCII以外の文字を含む行を選択するだけの場合は...

125
Texh

この式はASCII以外の値を検索します。

[^\x00-\x7F]+

[検索モード=正規表現]をオフにしてクリックします Find Next

出典:任意のASCII文字の正規表現

226
ProGM

メモ帳++では、メニューに移動すると検索範囲内の文字を検索非ASCII文字(128-255)あなたはそれから進むことができます各非ASCII文字への文書.

43
Anon Y. Mous

ProGMによる回答に加えて、NULやACKのようなボックス内の文字を見つけて取り除きたい場合、それらはASCII制御文字(0から31)です。次の式を削除してください。

[\x00-\x1F]+

ASCII以外のAND ASCII制御文字をすべて削除するには、この正規表現に一致するすべての文字を削除する必要があります。

[^\x1F-\x7F]+
19
brunorey

すべての非ASCII文字を削除するには、次のように置き換えます。[^\x00-\x7F]+

Removing non-ASCII

文字を強調表示するには、検索ウィンドウでMark関数を使用することをお勧めします。これはASCII以外の文字を強調表示し、それらの1つを含む行にブックマークを付ける

Highligh non-ASCII

代わりにASCII文字をハイライト表示してブックマークを付けるには、正規表現[\x00-\x7F]を使用します。

乾杯

17

改行するには:

  1. 最初に改行する文字を選択してください...私は#を使いました。
  2. 置換オプションを選択して拡張します。
  3. 入力\ n#に置き換えてください
  4. すべて置換置換

次:

  1. 置換オプション正規表現を選択します。
  2. これを入力してください:[^\x20-\x7E] +
  3. 空に置き換えてください
  4. すべて置換置換

さて、置換オプション拡張を選択し、#を#に置換します\ n

:)今、あなたはきれいなASCIIファイルを持っています;)

4
TooGeeky

もう一つの良いトリックはあなたが実際にこれらの変な文字を見てそれらを自分で削除できるようにあなたのエディタでUTF8モードに入ることです。

3
Gidon Wise

別の方法...

  1. まだ持っていない場合はText FXプラグインをインストールしてください
  2. TextFXメニューオプションに行きます - >すべての印刷不可能な文字を#にザップします。無効な文字はすべて3#記号に置き換えられます。
  3. 検索と置換に行き、###を探してください。スペースに置き換えてください。

正規表現を思い出せなかったり、調べても構わないのであれば、これはいい方法です。しかし、他の人によって言及された正規表現は、同様にいい解決策です。

1
goku_da_master