web-dev-qa-db-ja.com

syslogのimuxsockメッセージとシステムが応答しなくなる

このようなメッセージがsyslogに表示されます。

rsyslogd-2177: imuxsock lost 21869 messages from pid 3418 due to rate-limiting
rsyslogd-2177: imuxsock begins to drop messages from pid 3427 due to rate-limiting

私のサーバーは過去数日間応答しなくなり、マシンを2〜3回再起動する必要があります。

これらのメッセージが何であるか、およびこれらのメッセージがサーバーのダウンの原因になり得るかどうかをお知らせください。

6
shashuec

ほんの数秒前に、ロックまたはミューテックスのようにビジーなCPUループで単純なプロセスが1時間近くハングしていた問題を解決しました。 Syslogはこれらのメッセージを示しました:

Jan  9 12:15:43 Host1 rsyslogd-2177: imuxsock lost 354 messages from pid 157711 due to rate-limiting

とプロセス157711はpostfixでした。 service postfix restartすぐに問題を修正しました。

4
Jaakko Hyvätti

私の経験では、「rsyslogd-2177:imuxsockがpid yyyからのxxxメッセージがレート制限により失われました」というメッセージが、問題のログメッセージが削除されてから数日daysログに表示される可能性があります。これは、現在のログファイルで特定のpidへの他の参照を見つけることができず、そのpidからそれが何であったかを示す他のメッセージを見つけることができないことを意味します。

Logrotateなどを使用している場合、前週のアーカイブログをgrepすると、ドロップされたメッセージのソースが表示される可能性が高く、フラッディングを開始したメッセージが表示されます。

3
Nye

システムで制御不能なプロセスが実行されているようです...おそらく、マシンが危険にさらされている可能性があります(?)。

これらのログメッセージは rsyslogのレート制限機能 に関連しています。私は現在、私のマシンの1つで同様の問題を特定しようとしていますが、私の場合はそれほど深刻ではないように見えます。一度に失われるログメッセージは約100だけです。 (たとえば、「imuxsockは100メッセージを失った...」と表示されます)

「失われた」ログに記録されたメッセージのソースを追跡する洞察を誰かが持っている場合、それが最も役立ちます。私の問題はPostfixに関連している可能性があると思いますが、ログメッセージで指定されたプロセスID(「pid」番号)は関連がなくなったため(おそらくプロセスが存在しないため)、ピン留めするのは少し難しいです。 ..

2
Chris W.

同様の問題がありましたが、おそらくcronjobが失敗してメールを送信しようとしたことが原因です。このメールは停止され、postfixはそれを好まなかった。

1
SvennD