web-dev-qa-db-ja.com

サーバーがSSHおよびHTTPに応答しないが、pingは機能する

Sshとhttpのいずれも機能しなかったため、ハードリブートを要求しました。 pingは正常に機能しました。

問題が何であったかを理解するために、どのログを確認する必要がありますか?

ありがとう! (ランプ上のdebian 6)

編集:私の記憶とスワップ:

Mem:   4040068k total,  1114920k used,  2925148k free,   109212k buffers
Swap:  1051384k total,        0k used,  1051384k free,   283820k cached

4GBラム

(および1TB以上のHDD)

原因は2日前のものです:

スワップの使用量が10時間以内に+ 60%になる様子を見てください

私のコントロールパネルは、これを上位5つのメモリ使用プロセスとして報告します。

すべてのApache2プロセスが190MBの大きさである場合、TOPを実行すると262のスリーププロセスがあるため、それらのほとんどはApache2です。

私のApache mpm_prefork設定は次のとおりです。

<IfModule mpm_prefork_module>
    StartServers          5
    MinSpareServers       5
    MaxSpareServers      10
    ServerLimit      1500
    MaxClients            1500
    MaxRequestsPerChild   2000
</IfModule>

KeepAlive On


MaxKeepAliveRequests 100


KeepAliveTimeout 4
3
dynamic

Which logs should i check to understand what was the problem?

それらのすべて。 ping機能するということは、IPスタックがICMPエコー要求を処理するのに十分であることを意味します(SSHおよびWebサーバーに必要なものと比べて、システムの大部分ではありません)。私が「部分的なパニック」と呼ぶもの(カーネルが壊れたが、IPコードは実行され続けた)、RAM不足、または特定できない理由でSSH/HTTPdプロセスがフォールオーバーした可能性があります。

/var/log/messagesは、Webサーバー(おそらくApache)のログと同様に、おそらく良い出発点です。他に何もなければ、システムが最後に動作したのはいつか、再起動する前にシステムが脳死状態にあった時間の長さを知ることができます...


コメントに基づいて更新

何かにメモリリークがあるように聞こえます。
スワップが不足すると、ユーザーランドは爆発しましたが、カーネル(RAMに配線されている)は実行を続け、ping要求に応答する可能性があります。

永続的な解決策を得るには、スワップの使用率を注意深く監視し、危険なほど上昇傾向にあることに気付いた場合(> 33%が使用されていることが私のしきい値です)、最も多くのスワップが使用されているプロセスを探します。これが原因である可能性があります。

5
voretaq7