web-dev-qa-db-ja.com

LUKSで完全なシステムロックアップを経験している人はいますか?

最近、いくつかの新しいサーバーをセットアップしました。今回は、dmcrypt + LUKSを使用してほとんどのパーティションを暗号化しています。ただし、これらの新しいサーバーは、数日ごとに非常に頻繁にクラッシュします。完全なロックアップ、カーネルがキーボードに応答しない、システムがpingを実行しない。 Muninのグラフとトップレコードによると、リソース使用量の増加はありません。ローカルsyslogログに関連するログレコードはありません。リモートログホスト(新しいサーバーがsyslogを転送するホスト)に関連するレコードはありません。関連するnetconsoleメッセージはありません(新しいサーバーは、netconsoleを使用してすべてのカーネルメッセージをログホストに転送します)。カーネルはTTYに何も出力しませんでした。ホスティング会社に完全なハードウェアテストを実行するように依頼しましたが、何も見つかりませんでした。 LUKSを疑っています。他の誰かもLUKSで完全なロックアップを経験しますか?私が見つけた唯一の参照は http://ubuntuforums.org/showthread.php?t=2125287 です。

3
Hongli Lai

dmcrypt + LUKS パーティションにArchとDebianシステムをセットアップしようとしたときに同様の問題が発生しました。この問題は、6〜7 GBのデータを上書きした後、dd if=/dev/zero of=/dev/mapper/crypt1コマンドを使用してLUKSパーティションを安全に消去しているときに常に発生しました。 4x4GBに1つ、障害のあるメモリモジュールであることが判明しました。

cryptsetup FAQ page )のポイント4.3は、メモリの障害が暗号化されたデバイスへの書き込み中にどのように劇的な破損を引き起こす可能性があるか、およびフリーズやロックアップなどの関連する症状を説明しています障害のあるメモリを疑うため。

もし私があなただったら、そのホスティング会社が彼らのシステムをどのようにチェックしたかについて疑わしいでしょう。 Memtest86 +Memtester の少なくとも1サイクルの結果を転送するように伝えます。

[〜#〜] notes [〜#〜]

参考までに、ヒントと解決策を探しているときに経験した同様の問題を説明する投稿/ディスカッションのいくつかをリストしています。

  • この男 ウォッチドッグプロセスによっていくつかのCPUロックアップが報告されました。彼の問題は暗号化やメモリの障害ではなく、CPUファンの障害に関連しているようですが、これは私がハードウェアの問題を疑うようになったときです。
  • これらの人 同様の症状があるようで、スレッドの最後の文は「大量のRAM」に言及しています。
  • このスレッド (また ここ )は、パッチが当時提出されていた、はるか昔のカーネルバージョン2.6.24でのソフトロックアップの問題について説明しています。症状は似ているように見えますが、私にとっての根本的な原因は異なっていました。 この投稿 同じ問題についても説明しているようです。
1
Daniel Dinnyes