3か月に1回**クラッシュ*するDebian 2.6.38-3
サーバーで問題が発生しましたが、理由がわかりません。
Pingdomによると、サイトは午前4時頃に死亡しましたが、私が調べたログには、どのような種類のエラーについての情報も含まれていません。
これは私が調べたログファイルです:
与えられたログによると、間違っていることに注意してください。これは/var/log/messages
の例です。
Jan 21 04:01:46 debian god [1195]:アプリは10秒後もまだ生きています。 SIGKILLを送信しました
1月21日11:18:20 debianカーネル:imklog 3.18.6、ログソース=/proc/kmsgが開始されました。
どのログに私が探している情報が含まれている可能性がありますか?
**のようなクラッシュは何にも反応しません。画面が黒くなり、Webリクエストに応答せず、SSHを使用してアクセスできません。*
悲しいことに、おそらくそれらのどれも。カーネルパニックが発生すると、ログを書き込むためのログサブシステムがなくなり、ログを処理するためのファイルハンドルもなくなります。
唯一可能なことは、コンソールを/ dev/ttyS0にリダイレクトし、そこからの出力をログに記録するように別のサーバーをセットアップすることです。
そうすることで、カーネルパニックが発生した場合(それが発生している場合)は、シリアルポートを介して、監視サーバーからのログを追跡できます。
SIGKILLはプロセスを誰かによって強制的に強制終了しています。深い監視が必要だと思います。メモリ、処理、SWAP、負荷平均、プロセス数、実行中のすべてのサービスのゾンビを継続的に監視する必要があります。したがって、容疑者を見つけることができます。 nagiosをインストールし、上記のすべてを監視することをお勧めします。
うまくいけば、あなたはcrontabやカーネルのバグなどをチェックしたかもしれません。
ありがとう