web-dev-qa-db-ja.com

ターミナルで2つのテキストファイル間の一致を検索します

1,755,972行(1つの値/行)の大きな.txtファイルがあります。 1,400行(1つの値/行)の別の.txtファイルがあります。 2つのリスト間の順序に関係なく、2つの間の一致を確認したいと思います。

助言がありますか?

input1.txt

rs1
rs2
...
rsn

input2.txt

rs10
rs8
rs1
...
rsn
5
Mirna

ファイル内の順序に関係なく、2つのテキストファイルに共通の行を取得するには、次のようにします。

sort file1.txt > sorted1.txt
sort file2.txt > sorted2.txt
comm -12 sorted1.txt sorted2.txt

使用する sort -u一意の行のみを比較したい場合。

3
harrymc