区切りのないものも含めて、ファイル内のテキストの行数をカウントする方法はありますか？

Question

POSIX wcコマンドは、ファイル内のPOSIX行の数をカウントします。 POSIX標準では、lineを接尾辞付きのテキスト文字列として定義しています。がないと、純粋なテキスト文字列を行と呼ぶことはできません。

しかし、私にとっては、ファイル内のテキスト文字列の行数を数えるのがより自然です。それを行う簡単な方法はありますか？

root:[~]# printf "aa
bb" | wc -l 1 root:[~]# printf "aa
bb
" | wc -l 2 root:[~]#

St&#233;phane Chazelas · Answer

GNU sedでは、以下を使用できます。

sed '$=;d'

GNU sedは、最後の改行の後の余分な文字を追加行と見なします。GNU sed like like GNU utility入力でNUL文字もサポートし、行の長さに制限はありません（POSIXに従って入力を非テキストにする他の2つの基準）。

POSIXLy、長すぎる行とNULバイトをサポートするために @ Inianの答えを構築：

LC_ALL=C tr -cs '
' '[x*]' | awk 'END {print NR}'

そのtrコマンドは、改行以外の1つ以上の文字のシーケンス（デコードの問題を回避するためにCロケールで文字として解釈される各バイト）をonex文字に変換するため、awk inputレコードの長さは0または1バイトで、その入力にはxと改行文字のみが含まれます。

$ printf '%10000s
a\0b
c
d' | wc -l 3 $ printf '%10000s
a\0b
c
d' | mawk 'END{print NR}' 2 $ printf '%10000s
a\0b
c
d' | busybox awk 'END{print NR}' 5 $ printf '%10000s
a\0b
c
d' | gawk 'END{print NR}' 4 $ printf '%10000s
a\0b
c
d' | LC_ALL=C tr -cs '
' '[x*]' | mawk 'END{print NR}' 4

Inian · Answer

これにはawkを使用できます。これには、ファイルの先頭から現在のレコードの数を追跡する特別な変数NRがあります。変数は各行の終わりで増分されます。 ENDブロックで出力されると、つまりすべての入力行が処理された後、最後に処理されたレコードの番号が出力されます。

printf "aa
bb" | awk 'END { print NR }' 2 printf "aa
bb
" | awk 'END { print NR }' 2