web-dev-qa-db-ja.com

RAID5ディスク上のデータはどのように「スクランブル」されていますか?

私の懸念は、プライベートRAID5ディスクアレイから交換したディスクを廃棄することです。

個人用のRAID5ディスクアレイからディスクを交換する必要がありました。エラーが発生し始めたので、それは消えました。

しかし、今、私はこのディスクを机の上に置いているので、疑問に思いました...アレイ上のデータは暗号化されていません。リサイクルステーションで提出することは、セキュリティ上のリスクになるのではないかと心配しています。
いたずら好きな人がディスクから個人データ(写真、ファイルなど)を取得できる可能性はありますか?それとも、RAID5アレイの一部であったという事実は、データが認識できないほどスクランブルされているのに十分ですか?

40
Mausy5043

これを実際にテストするために、以前はRAID-6アレイの一部であったディスク(Seagateのおかげで利用可能になりました)に Foremost のコピーをポイントしました。アレイのチャンクサイズは512KBだったため、理論的には512KB以下のファイルはそのまま残っています。アレイ上のデータは、私が所有しているすべてのコンピューターのディスクイメージを含め、約25年間のコンピューター使用からのものです。

私が回復したデータの量は、正直なところ、恐ろしいものでした。高校の宿題を含むWord文書。数十年前にアンインストールしたゲームのデータファイル。 DLL WINEの100の異なるバージョンからのファイル。未読のUsenet投稿に添付された画像。1万のキャッシュされたWebページ。カスタム抽出ルールを追加すると、3つのSSL秘密鍵とSSH鍵が見つかりました。

注意すべきもう1つの点は、妥協する情報を得るために常にファイル全体を抽出する必要はないということです。たとえば、PDFの最初の512kは目次を与えることができ、BMPの最初の512kはキャプションを与えることができます(BMPはその画像データは上下逆に)、JPEGの最初の512kはサムネイルを提供します。MPEGおよびMP3ファイルはストリーミング可能に設計されているため、途中からのチャンクでも誰かに有用なデータを提供できます。

RAID 5ディスク上のデータはどのようにスクランブルされていますか?スクランブルが不十分。

35
Mark

RAID 5はディスク全体にデータをストライピングしますが、ストライピングに使用されるブロックは通常かなり大きいです。少なくとも、それらはセクター全体になりますが、通常はそれよりもはるかに大きくなります。たとえば、madmのデフォルトはハーフメガバイトのチャンクです。 1つのセクターでも十分に大きいため、再認識可能なテキストのチャンクが見つかる可能性が高く、通常のチャンクサイズでは、認識可能なファイル全体がアレイの個々のドライブに存在する可能性が非常に高くなります。

60
Peter Green

人のように聞こえると、ドライブセクターサイズ(通常512B〜4KB)とRAID 5ストライプサイズ(通常16KB〜128KB、場合によってはそれ以上)を混同しているようです。 RAIDストライプサイズは、アレイの書き込み可能な論理サイズであるため、各ドライブのストライプの各部分には、その量のデータが含まれます。ファイル全体がストライプサイズに収まる場合、そのすべてがリムーバブルドライブ上の連続したブロックとして表示される可能性があります。

15
Steve Dirickson

RAID 5アレイの単一のメンバーは、プレーンブロックとパリティブロックで構成されます。たとえば、4メンバーアレイの場合、75%プレーンと25%パリティです。プレーンブロックはプレーンビューで読み取ることができます。これらのブロックのスクランブルはありません。意味を理解するために他のメンバーを参照する必要はありません。これらのブロックのサイズは通常16KBから512KBですが、RAID-5の場合、書き込み増幅を最小限に抑えるために、これは通常128KB以下です。そのような単純なブロックに表示される機密データを読み取るための十分な範囲があります。

各パリティブロックには、他のドライブ上の3つのプレーンブロックから生成されたデータが含まれています。これにより、他の3つのドライブ(4メンバーアレイ内)のいずれかが失われた場合に、アルゴリズムをパリティに適用することで情報を回復できます。ブロックと残りの2つのドライブからのブロック。パリティブロック内のデータは意味がなく、組み合わせて他の3つのブロックの2つのコンテンツを推測できない限り、それ自体で回復することはできません。3つのブロックのうち2つが空の場合、簡単な場合もあります。 (ゼロ)または予測可能なデータを含みます。したがって、それは暗号的に安全ではありませんが、パリティブロックの情報は、それが生成された他の3つのブロックのうち2つがなければ一般的に役に立ちません。

RAID 4はRAID 5と同様の設計でしたが、すべてのパリティブロックが1つのドライブに保存されていたため、そのドライブしかなければ、簡単に回復できるデータはありませんでした。 RAID 5はこれを変更して、パリティブロックをメンバー間で均等に分散しました。つまり、ドライブ自体には多くのプレーンブロックが含まれ、そこからデータを回復できます。

8
thomasrutter

それとも、RAID5アレイの一部であったという事実は、データが認識できないほどスクランブルされているのに十分ですか?

経験則では、このような状況(リサイクル、寄付など)の下で消去する前に、常に消去磁気メディアを保護することになります。暗号化されているかどうか、RAID0であるかRAID 5であるかなど、基礎となるデータについて何も想定しないでください。

現代の知恵が何かが安全であるということであったとしても、経験はそのような信念が将来無効にされる可能性があることを私たちに示しました(例えば、Spectre/Meltdownのセキュリティ問題が検出されなかった年数を見てください。 )。

4
Phylyp

私が働いているデータセンターでは、データのセキュリティを非常に重視しています。ドライブが暗号化されていないアレイの一部である場合は、ドライブから取得できる十分なデータがまだあります。 スクラブ ドライブがまだ機能している場合、または機能していない場合は、正直にお勧めします 脱磁 何らかの制御された磁気デバイスを備えたドライブ。

2
Terrance