1,755,972行(1つの値/行)の大きな.txtファイルがあります。 1,400行(1つの値/行)の別の.txtファイルがあります。 2つのリスト間の順序に関係なく、2つの間の一致を確認したいと思います。
助言がありますか?
input1.txt
rs1
rs2
...
rsn
input2.txt
rs10
rs8
rs1
...
rsn
ファイル内の順序に関係なく、2つのテキストファイルに共通の行を取得するには、次のようにします。
sort file1.txt > sorted1.txt
sort file2.txt > sorted2.txt
comm -12 sorted1.txt sorted2.txt
使用する sort -u
一意の行のみを比較したい場合。