私のプログラムは、改行文字が\ n、\ r\n、または\ r(例:Unix、PC、またはMacスタイル)のデータを受け入れることができます。
エンコーディングが何であっても一致する正規表現を構築する最良の方法は何ですか?
あるいは、入力にuniversal_newlineサポートを使用することもできますが、今は正規表現がどうなるかを知りたいです。
正確にしたいときに使用する正規表現は"\r\n?|\n"
。
一貫性や空の行が気にならない場合は、"[\r\n]+"
、私はそれが私のプログラムを0.2%のオーダーでどこか速くすることを想像します。
古いMacスタイル(OS 9は2002年2月以降サポートされていない)に対処する必要がないため、パターンを\r?\n
に簡略化してパフォーマンスを少し向上させることができます。