ビット単位-または2つのバイナリファイル

Question

しばらく前に、死にかけているHDDで2回のレスキューを試みました。私は（GNU）ddrescueを最初に実行し、次に手動シークでddをまっすぐに実行しました。両方の画像を最大限に活用したいと思います。ファイル内の空のストレッチは0になるため、2つのファイルをマージするにはビット単位のANDで十分です。

2つの入力ファイルのOR）であるファイルを作成できるユーティリティはありますか？

（私はArchLinuxを使用していますが、リポジトリにない場合はソースからインストールできます）

Chris · Answer

これを行うユーティリティはわかりませんが、これを行うプログラムを作成するのは非常に簡単です。これがPythonの骨格例です：

#!/usr/bin/env python f=open("/path/to/image1","rb") g=open("/path/to/image2","rb") h=open("/path/to/imageMerge","wb") #Output file while True: data1=f.read(1) #Read a byte data2=g.read(1) #Read a byte if (data1 and data2): #Check that neither file has ended h.write(chr(ord(data1) | ord(data2))) #Or the bytes Elif (data1): #If image1 is longer, clean up h.write(data1) data1=f.read() h.write(data1) break Elif (data2): #If image2 is longer, clean up h.write(data2) data2=g.read() h.write(data2) break else: #No cleanup needed if images are same length break f.close() g.close() h.close()

または、より高速に実行する必要があるCプログラム（ただし、気付かれないバグがある可能性が大幅に高くなります）：

#include <stdio.h> #include <string.h> #define BS 1024 int main() { FILE *f1,*f2,*fout; size_t bs1,bs2; f1=fopen("image1","r"); f2=fopen("image2","r"); fout=fopen("imageMerge","w"); if(!(f1 && f2 && fout)) return 1; char buffer1[BS]; char buffer2[BS]; char bufferout[BS]; while(1) { bs1=fread(buffer1,1,BS,f1); //Read files to buffers, BS bytes at a time bs2=fread(buffer2,1,BS,f2); size_t x; for(x=0;bs1 && bs2;--bs1,--bs2,++x) //If we have data in both, bufferout[x]=buffer1[x] | buffer2[x]; //write OR of the two to output buffer memcpy(bufferout+x,buffer1+x,bs1); //If bs1 is longer, copy the rest to the output buffer memcpy(bufferout+x,buffer2+x,bs2); //If bs2 is longer, copy the rest to the output buffer x+=bs1+bs2; fwrite(bufferout,1,x,fout); if(x!=BS) break; } }

Zaz · Answer

Python

with open('file1', 'rb') as in1, open('file2', 'rb') as in2, open('outfile', 'wb') as out: while True: bytes1 = in1.read(1024) bytes2 = in2.read(1024) if not bytes1 or not bytes2: break out.write(bytes(b1 | b2 for (b1, b2) in Zip(bytes1, bytes2)))

これは、一度に1024バイトを読み取るため、ChrisのPythonソリューションよりも約10倍高速です。また、ファイルを閉じる際の信頼性が高いため、with openパターンを使用します（例：エラーの）。

これはPython 3.6.3（2つの部分的なトレントファイルを正常にマージする）で機能するようですが、完全にはテストされていません。

おそらく、if ...: breakパターンを削除して、代わりにwhile in1 or in2:を使用することができます。

frostschutz · Answer

これはビット単位ではありませんが、ゼロ（のブロック全体）に対して機能します。

dd conv=sparse,notrunc if=foo of=baz dd conv=sparse,notrunc if=bar of=baz

sparseのため、ソースファイルへのゼロ以外の書き込みはスキップされます。

したがって、bazはbarのように見えますが、barではゼロでしたがfooではゼロではありませんでした。

言い換えると、fooとbarで同一ではないゼロ以外のデータがある場合、barが優先されます。