ロシア語で書かれた一人の男からWordファイルを取得し、HTMLに変換しました。
これらのファイルには、以下のような奇妙な空白文字が含まれています。
これは小さなゼロのように見えます(特殊文字を表示するようにモードを変更しました)。非表示モードでは、それは単なるスペースです。
ファイルをHTMLに変換するときにこれらの文字が見苦しく見えるという問題。
それらを削除する必要があります。しかし、それらを検索すると、それらを使用スペース(ドットのように見える)と区別できないため、手動ですべてのファイルをスキャンして、それらを見つけて削除します。
では、これらの特別なシンボルを見つけて削除するにはどうすればよいですか?
その記号は、ノンブレークスペース(NBSP)と呼ばれ、Unicode U+00A0
にあります(正しく指摘したように、これはUnicode U+0020
である通常のスペースとは異なります)。
非改行スペースは、2つの単語の間に空白を入れたいが、Word(またはそれらをサポートする他のテキストエディター)で改行または改行を入れたくない場合に使用されます。たとえば、「このコンピューターはMicrosoft Windowsをサポートしています」という文章を書きたい場合に便利です。 「Microsoft」と「Windows」の間の改行なし。
Word文書でそれらを見る際の問題については、簡単に修正できます。必要なことは、NBSPの例をコピーして貼り付け、検索と置換の検索部分に入れてから、通常のスペースを置換部分に入力することです。これで問題が解決するはずです。
NBSPの詳細については、興味があれば Wikipediaで を参照してください。ただし、HTMLは任意の数の連続する通常のスペースを1つのスペースとして扱いますが、NBSPを特別に処理します(HTML出力で
として表されているのをご覧になったかもしれません)。これは、CSSが適していない場合(またはすばやく簡単なハックが必要な場合のみ)に、ユーザーが間隔をもう少し細かく制御できるようにするためです。したがって、最終的にはHTMLでNBSPが役立つことに気付くかもしれませんが、HTMLソースは間違いなく乱雑であり、不要な場合は迷惑です。
また、自分でWordにNBSPを挿入する方法を知りたい場合もあります。Wikipediaから常にコピーアンドペーストする必要はありません。記号の挿入ダイアログから挿入できます(挿入タブ>記号>特殊文字>改行なしスペース)ショートカットを使用することもできます Ctrl+Shift+Space。 [検索と置換]ダイアログでは、More >>
、Special
ドロップダウン、[Nonbreaking space
]の順にクリックして挿入することもできます。
通常のスペースをWordで検索すると、改行されないスペースも検索されます。したがって、「検索対象」フィールドと「置換:」フィールドの両方にスペースを挿入するだけで、改行なしスペースをすべて通常のスペースに変換できます。