TextpadまたはNotepad ++には、正規表現検索のすべての一致を単一のリストとしてエクスポートするオプションがありますか?
大きなテキストファイルで、正規表現%\< and \>%
を使用してタグ(%%で囲まれた単語)を検索し、すべての一致を単一のリストとして必要とするため、Excelを使用して重複を削除し、リストを取得できます。ユニークなタグの。
これは、Notepad ++の Backreferences および検索とマーク機能を使用して実現できます。
正規表現(たとえば%(.*?)%
)を使用して一致を検索し、それを_\n%\1%\n
_で置き換えます。この後、ターゲットのWordが別々の行に表示されます(つまり、一致するWordが複数ある行はありません)。
検索->検索->マーク機能を使用して、各行を正規表現%(.*?)%
でマークし、「ブックマーク行」にチェックマークを付けることを忘れないでください'テキストをマークする前
これを行うとin Notepad ++が必須要件になりますか? Windowsまたは何らかの形式のUnixを使用していますか? Windowsを使用している場合は、コマンドプロンプトから(部分的に)実行できます。
findstr/r "%[a-z]。* [a-z]%%[a-z]%" your_file > new_file
findstr
は漠然とgrep
に触発されているため、これは new_file 検索条件に一致するすべてのlinesが含まれます。次に、Notepad ++を使用して、不要なテキストを削除します(最初の%の左側と2番目の%の右側)。
もちろん、UNIXを使用している場合は、sed
を使用して同等のタスクを実行できます。
一致した正規表現を新しいタブの新しいファイルにコピーできるNotepad ++プラグインがあります。 RegexExtract
現在のドキュメントからテキストを抽出したり、いくつかの追加設定(大文字と小文字の変換など)がある場所からすべてのファイルを抽出したりできるNotepad ++のプラグインが見つからなかったため、自分で作成することにしました。 (...)プラグインインターフェイスはかなり単純です(...)。 (...)「検索」、「置換」、および「マスク」フィールドは、C++ 11正規表現構文を使用します。現在、ファイルからの抽出は、UTF8のファイルに対してのみ機能します。
編集質問に合わせたダイアログ入力
画像では、ダイアログの入力方法を確認できます。 Wordにはスペースなどが含まれておらず、\ wで一致する文字のみが含まれていると思います。特に:
TextPadでは、通常どおりFind
ボックスを表示し、Mark All
ボタンを使用します。
そこから、Copy Bookmarked Lines
関数を使用します。 (編集メニュー>他をコピー>ブックマークされた行。)