このようなメッセージがsyslogに表示されます。
rsyslogd-2177: imuxsock lost 21869 messages from pid 3418 due to rate-limiting
rsyslogd-2177: imuxsock begins to drop messages from pid 3427 due to rate-limiting
私のサーバーは過去数日間応答しなくなり、マシンを2〜3回再起動する必要があります。
これらのメッセージが何であるか、およびこれらのメッセージがサーバーのダウンの原因になり得るかどうかをお知らせください。
ほんの数秒前に、ロックまたはミューテックスのようにビジーなCPUループで単純なプロセスが1時間近くハングしていた問題を解決しました。 Syslogはこれらのメッセージを示しました:
Jan 9 12:15:43 Host1 rsyslogd-2177: imuxsock lost 354 messages from pid 157711 due to rate-limiting
とプロセス157711
はpostfixでした。 service postfix restart
すぐに問題を修正しました。
私の経験では、「rsyslogd-2177:imuxsockがpid yyyからのxxxメッセージがレート制限により失われました」というメッセージが、問題のログメッセージが削除されてから数日daysログに表示される可能性があります。これは、現在のログファイルで特定のpidへの他の参照を見つけることができず、そのpidからそれが何であったかを示す他のメッセージを見つけることができないことを意味します。
Logrotateなどを使用している場合、前週のアーカイブログをgrepすると、ドロップされたメッセージのソースが表示される可能性が高く、フラッディングを開始したメッセージが表示されます。
システムで制御不能なプロセスが実行されているようです...おそらく、マシンが危険にさらされている可能性があります(?)。
これらのログメッセージは rsyslogのレート制限機能 に関連しています。私は現在、私のマシンの1つで同様の問題を特定しようとしていますが、私の場合はそれほど深刻ではないように見えます。一度に失われるログメッセージは約100だけです。 (たとえば、「imuxsockは100メッセージを失った...」と表示されます)
「失われた」ログに記録されたメッセージのソースを追跡する洞察を誰かが持っている場合、それが最も役立ちます。私の問題はPostfixに関連している可能性があると思いますが、ログメッセージで指定されたプロセスID(「pid」番号)は関連がなくなったため(おそらくプロセスが存在しないため)、ピン留めするのは少し難しいです。 ..
同様の問題がありましたが、おそらくcronjobが失敗してメールを送信しようとしたことが原因です。このメールは停止され、postfixはそれを好まなかった。