web-dev-qa-db-ja.com

RAID 5構成のドライブ障害から回復するにはどうすればよいですか?

今朝、データベースサーバーでドライブが故障しました。ドライブアレイ(3つのディスク)はRAID 5構成でセットアップされます。

ドライブの交換を待つ間、復旧戦略の準備をしています。ユーザーはシステムの作業を続けていますが、非常にゆっくりです(理由はわかりませんか?)。

どのようにして新しいドライブをインストールしますか?このドライブのデータはパリティから自動的に再構築されますか、それとも私たちが従うべき別のプロセスがありますか?

編集:これはハードウェアRAIDコントローラです。 (これまでの回答をありがとう、感謝)

15
Philip Fourie

追加のCPUとI/Oを含む不足しているデータを再構築する必要があるため、システムの実行速度が非常に遅くなります。

RAID-5構成でディスクが欠落している場合は、リカバリ戦略なしです。別のディスクがダウンした場合データが失われます。歩いてはいけません。最寄りのベンダーに出向いてください。ベンダーから、互換性のある部品を、メーカーの保証付きで、同日緊急の宅配便で発送できます。アレイを購入したベンダーがすでに部品を入手している場合は、両方の部品を入手し、もう一方をスペアとして隠しておいてください。

運用システムでRAID-5を使用している場合は、アレイ内のスペアディスクをホットスペアとして残すことを検討してください。

追加-ログが別のボリューム(物理的に別のディスク)にない場合、それらを別のディスクセットに移動します。ミラーリングされたペアが1つだけであってもです。これは、ログボリュームの競合がパフォーマンスに過度に悪い影響を与えるため、データベースに大きな負荷がかかっている場合にもパフォーマンスが向上します。

これが可能な場合は、次の手順を実行してデータベースをより堅牢にすることもできます。

  1. データベースをシャットダウンします。
  2. データベースをバックアップします。
  3. ログを物理的に分離したディスクのセットに移動します(ログがどこに移動されたかがわかるようにデータベースを再構成してください)。
  4. データベースとアプリケーションを再起動します。

別のボリュームにログがある場合は、バックアップから復元してロールフォワードすることができますif if only if ifディスク障害が発生してもログは損なわれません。次の理由により、データベースログは別のディスクボリュームに配置する必要があります。

  • ログの使用パターンは主に順次的で、ログエントリがファイルの最後に追加されます(ファイルは事実上リングバッファーです)。つまり、ディスクヘッドのシークアクティビティがほとんどないため、多数のログエントリをすばやく書き出すことができます。

  • ランダムアクセスのワークロードが大きい物理ディスク(トランザクションテーブルやインデックスなど)を共有している場合、ヘッドシークアクティビティがシーケンシャル書き込みを中断するため、不均衡に速度が低下します。

  • ログを別のボリュームに置くことは、ほとんどの場合パフォーマンスの向上であり、非常に重いワークロードをサポートするためにログにミラーリングされた単一のペアが必要です。これは、それを実行するためのハードウェアが非常に安価であることを意味します。したがって、パフォーマンスと信頼性を大幅に向上させるための小さなコストがかかります。

  • データ配列がダウンしても、ログは失われません。適切なバックアップ戦略がある場合は、バックアップから復元し、ログからロールフォワードできます。これは、アレイ全体が単一障害点になることなくサーバーでダウンする可能性があることを意味します。データの損失を引き起こすには、ログとデータ配列の両方が同時に失敗する必要があります。

1)バックアップ。

現在、データは失われていません。バックアップが最新のバックアップでない場合。

2)マニュアルを読んだり、ベンダーに連絡したりします。

RAIDシステムが異なれば、ディスクを交換する手順も異なります。誤って実行すると、アレイ全体が破壊される危険があります。どのような種類のRAIDハードウェア/ソフトウェアがあるかを知らなければ、必要なステップでしか推測できません。

また、パフォーマンスが遅いのは、劣化した状態のRAID 5(つまり、1つのディスクが停止している)の読み取りパフォーマンスがひどいためです。どれほど恐ろしいかは、パリティの保存方法とどのディスクが停止したかによって異なりますが、「良い」ニュースは、1つのディスクが失われてパフォーマンスが低下することです。これは既知の問題であり、パニックの原因にはなりません。

5
DrStalker

まず、使用しているハードウェア/ソフトウェアのマニュアルを読みます-障害回復のセクション:)

ただし、ディスクを交換してアレイを再構築するだけの簡単なことです。

このような場合の最も重要な点は、別のディスクに障害が発生するとデータが失われる可能性があるため、ディスクをできるだけ早く交換する必要があることです。また、障害の原因に対処する必要があります。それは、ディスクが古くなったためですか?他のものも交換する必要がありますか?それとも、電力サージ、熱、または振動が原因でしたか?

4
Svet

RAID5を理解している限り、故障したドライブを交換すると、他の2つのドライブに保存されている情報から自動的に再構築されます。新しいドライブを所定の場所に「ホットスワップ」できるかどうかは、システムによって異なります。最初に電源を切る必要がある場合があります。どちらの方法でも、ドライブのコストが比較的低く、データの重要性(最初にRAID5を使用するという決定に反映されています)を考慮すると、予備のドライブを引き出しに入れ、そのような事態に備えておく必要があります。 。

最近、自分用に新しい開発用PCを構築し、メインデータドライブをRAID5でセットアップしました。必要以上のドライブを注文したので、緊急事態に備えてスペアを準備しました(これが起こらないことを望んでいます)。

さて、あなたは質問をしましたが、私はその主題についてもう少し読んだほうがいいと思います。

1
belugabob

完全にシステム依存。マニュアルには何と書いてありますか?ハードウェアは、コントローラーからドライブベイへの新しいドライブのホットプラグを完全にサポートしていますか?最近のバックアップはありますか?

0
Thorsten79

NXCの投稿はそれをうまくまとめています。 2番目の障害が発生する前に障害のあるドライブを交換しない場合でも、ほとんどすべて(場合によってはすべて)が専用の回復サービスによって回復される可能性は十分にあります。データはまだディスク上にあり、障害が発生したディスクは通常、適切な機器を備えた専門ラボで元に戻すことができます。しかし、このサービスの価格はかなり高いです。スペアディスクと適切なバックアップ(NXCの提案に従って)を用意することは、間違いなく将来の道のりです。

0
NoOffense