私たちは、CERC6chレイドコントローラーを搭載した古いDellPowerEdge830を使用している小さな会社です。サーバーは、ファイルサーバー、ドメインコントローラー(Windows Server 2003)、MySQLサーバーなどです。2年ほど一緒に作業してきたsysadminがあり、通常は問題なく動作しますが、彼は国外にいて、到達不能な権利を持っています。今。
昨日、マネージャーから、サーバーのアラーム音が非常に大きく、停止しないという電話がありました。サーバーへのファイルの保存やファイルの読み取りのエラーについて、オフィスの誰も文句を言いませんでした。私はオフィスに来てグーグルをし、アラームがRAIDに関連していて、それを消音するBIOS設定があることを確認しました(不良ドライブを交換できるまで)。そうそう、ドライブの1つで機械的な故障が聞こえたと言うのを忘れました。だから私はレイド構成に入り、アラームを見つけてそれを沈黙させます。もちろん、これには再起動が必要でした。再起動中に、ドライブが故障して死んでいるのが聞こえました。また、「RAID SATA 0をオフラインまたは再構築しています」というBIOSメッセージがいくつかありました(正確には言われていませんが、申し訳ありません)。 t書き留めてください)
簡単に言うと、サーバーが再起動し、アラームが発生してから(つまり、ディスクに障害が発生して)から再起動するまでの間にディスクに書き込まれていたすべてのデータがなくなっていることがすぐにわかりました。再起動後にいくつかのファイルを保存しましたが、それらは追加の再起動後も持続しました。ただし、最初の再起動までに日曜日、昨日、今日に保存されていたファイルはなくなりました。
これは私を完全に驚かせます。RAID-1はミラーリングされているのに、なぜデータが欠落しているのでしょうか。オフィスの人々は、再作成する必要のあるすべてのファイルについて不平を言い始めました(ああ、バックアップにもファイルがありません)。私は、これらすべてについてもう少し理解できるまで、それらを停止しました。あなたのプロへの私の質問は:そのデータを復元するためにできることはありますか?問題を解決するために従う必要のあるRAIDユーティリティまたはプロセスはありますか?言い換えれば、これまで説明してきたことは、障害イベントでは正常に聞こえますか?他のディスクが死んでいることをレイドに伝え、ミラーリングされたデータに依存するために実行する必要がある追加の手順がいくつかあります残りのドライブ?
サーバーとサーバーが実行しているさまざまなサービスの管理はかなり快適ですが、RAIDとハードウェア全般に関しては、まったくの初心者であり、実際のデータが危機に瀕していることを考えると、試用を開始するのは気が進まないです。 -n-プロセスの途中でエラーが発生しました。
RAIDが、故障したドライブを使用して起動または再構築することを決定したようです。一方のドライブに障害が発生すると、RAIDはもう一方のドライブに書き込みを続け、システムは障害が発生したドライブから何らかの方法で再起動します。おそらくそれは少しだけ失敗しています。
うまくいけば、それは実際にドライブに失敗し、再構築を試みませんでした。
いずれにせよ、私の最初の提案はこれです。システムの電源を切り、ドライブの1つを取り外します(音を立てているドライブから始めます)。次に、起動して、データが存在するかどうかを確認します。そうでない場合は、他のドライブに切り替えて、そのドライブだけが接続されるようにしてください。何も変更せずにドライブの内容を検査できるように、livecdなどを使用してシステムを起動する必要がある場合があります。
どちらのドライブにもデータが表示されない場合は、運が悪い可能性があります。