ファイル内の繰り返し数をカウントし、繰り返して整理するにはどうすればよいですか？

Question

多くの繰り返しを整理する必要があるファイルがあります。ファイルには6行と3120行があり、各メンバーには1桁または2桁、合計18720桁の1桁または2桁があります。

ファイルに何個あるか1、何個2、何個3などを数えたいと思います。例：

5 7 13 25 26 44 12 21 26 28 32 44 10 20 22 26 40 44 13 18 19 20 22 23 9 15 17 19 22 43 10 19 28 29 37 45 2 8 12 13 22 35 3 23 24 26 38 39 3 14 19 20 33 43 2 3 8 35 36 43 2 8 25 29 37 43 3 24 27 29 38 44 5 20 23 32 33 40 11 17 22 26 33 36 1 6 31 32 39 44 4 22 27 31 36 43 3 6 18 22 35 44 11 13 24 28 32 33 17 22 27 29 42 44 8 9 16 23 29 44 13 19 20 33 37 40 18 21 29 31 34 44 14 15 20 31 32 41 6 32 33 40 41 43 11 17 18 31 43 44 1 9 10 22 24 34 6 8 9 35 37 38 14 18 21 36 40 43 11 16 17 32 34 38 1 5 14 22 23 24 5 19 21 22 32 45 12 17 20 22 32 44 9 27 32 38 42 44 4 12 16 26 42 45 6 7 8 16 39 42 5 6 13 18 27 28

出力：

最初の繰り返し回数が最も多い

5 = 30 5回30回再犯

4 = 28 4回28回再犯

.........

35 = 0 35回0回繰り返される

私はこれを試してみましたが機能しません。コードを変更する専門家でもありません。

$ tr -s " " "
" | sort | uniq -c | sort -n r | awk '{print $2 " = " $1}' $ awk -v RS='\s+' '{cnt[$0]++} END{PROCINFO["sorted_in"]="@val_num_desc"; for (i in cnt) print i" = "cnt[i]}' file $ tr -s ' ' '
' <file | sort | uniq -c | sort -nr | awk '{print $2 " = " $1}' $ tr -s ' ' '
' <nums | sort | uniq -c | sort -k1,1nr -k2n | awk '{print $2 " = " $1}' $ awk -v RS=" +|
" '{a[$1]++}END{for(x in a)printf "%d = %d
",x,a[x]}' file $ awk -v RS=" +|
" '{a[$1]++}END{for(x in a)printf "%d = %d
",x,a[x]}' f|sort -nr -k3

heemayl · Answer

できるよ：

tr -s ' ' <file.txt | tr ' ' '
' | sort -n | uniq -c | sort -k1,1rn -k2,2rn | sed 's/^ \+//; s/ /=/'

tr -s ' 'は連続するスペースを1つにします
tr ' ' ' 'はスペースを改行に変換します
sort -nは数値を実行しますsort- ing
uniq -cがカウントを行います
sort -k1,1rn -k2,2rn | sed 's/^ \+//; s/ /=/'は、出力を希望する方法でフォーマットします。

例：

$ tr -s ' ' <file.txt | tr ' ' '
' | sort -n | uniq -c | sort -k1,1rn -k2,2rn | sed 's/^ \+//; s/ /=/' 12=44 12=22 10=32 8=43 7=20 6=33 6=29 6=26 6=19 6=18 6=17 6=13 6=8 6=6 5=40 5=38 5=31 5=27 5=24 5=23 5=9 5=5 5=3 4=42 4=37 4=36 4=35 4=28 4=21 4=16 4=14 4=12 4=11 3=45 3=39 3=34 3=10 3=2 3=1 2=41 2=25 2=15 2=7 2=4

John1024 · Answer

これにより、発生回数の降順でソートされた、数値の発生回数のカウントが生成されます。

$ awk '{for (i=1;i<=NF;i++) a[$i]++;} END{for (i in a)print i"="a[i]}' file | sort -rnt= -k2,2 44=12 22=12 32=10 43=8 20=7 8=6 6=6 33=6 29=6 26=6 19=6 18=6 17=6 13=6 [...snip...]

上記の44=12は、44が12回繰り返されたことを意味します。

GNU awk

GNU awk（gawk）がインストールされている場合、パイプラインの必要性を排除し、すべてを1つのawkステートメントで実行できます。

awk 'BEGIN{PROCINFO["sorted_in"]="@val_num_desc"} {for (i=1;i<=NF;i++) a[$i]++;} END{for (i in a)print i"="a[i]}' file

user216043 · Answer

ちょうどAWKのバリエーション（私は長い間AWKを持っていません...）

awk -v RS="[ 
]+" '{a[$1]++} END{ for(b in a){print b,a[b] | "sort -rnk2,2"}}'