最近、いくつかの新しいサーバーをセットアップしました。今回は、dmcrypt + LUKSを使用してほとんどのパーティションを暗号化しています。ただし、これらの新しいサーバーは、数日ごとに非常に頻繁にクラッシュします。完全なロックアップ、カーネルがキーボードに応答しない、システムがpingを実行しない。 Muninのグラフとトップレコードによると、リソース使用量の増加はありません。ローカルsyslogログに関連するログレコードはありません。リモートログホスト(新しいサーバーがsyslogを転送するホスト)に関連するレコードはありません。関連するnetconsoleメッセージはありません(新しいサーバーは、netconsoleを使用してすべてのカーネルメッセージをログホストに転送します)。カーネルはTTYに何も出力しませんでした。ホスティング会社に完全なハードウェアテストを実行するように依頼しましたが、何も見つかりませんでした。 LUKSを疑っています。他の誰かもLUKSで完全なロックアップを経験しますか?私が見つけた唯一の参照は http://ubuntuforums.org/showthread.php?t=2125287 です。
dmcrypt + LUKS パーティションにArchとDebianシステムをセットアップしようとしたときに同様の問題が発生しました。この問題は、6〜7 GBのデータを上書きした後、dd if=/dev/zero of=/dev/mapper/crypt1
コマンドを使用してLUKSパーティションを安全に消去しているときに常に発生しました。 4x4GBに1つ、障害のあるメモリモジュールであることが判明しました。
cryptsetup FAQ page )のポイント4.3は、メモリの障害が暗号化されたデバイスへの書き込み中にどのように劇的な破損を引き起こす可能性があるか、およびフリーズやロックアップなどの関連する症状を説明しています障害のあるメモリを疑うため。
もし私があなただったら、そのホスティング会社が彼らのシステムをどのようにチェックしたかについて疑わしいでしょう。 Memtest86 + と Memtester の少なくとも1サイクルの結果を転送するように伝えます。
[〜#〜] notes [〜#〜]
参考までに、ヒントと解決策を探しているときに経験した同様の問題を説明する投稿/ディスカッションのいくつかをリストしています。