Linux v22017032713145956 3.16.0-4-AMD64 #1 SMP Debian 3.16.39-1+deb8u2 (2017-03-07) x86_64 GNU/Linux
これは、KVM仮想化を使用するノードで実行される仮想化サーバーです。
rcu_sched detected stalls on cpu
に関するカーネルメッセージがサーバーが実行されているノードと関係があるかどうかをサポートに尋ねる電子メールのほかに、これの記録はありません。noop
に設定してみてください監視により、サーバーが次の間のpingに応答しないことが報告されました。
これらの時間枠での/var/log/kern.log
:
何が問題ですか?何もインストールしたことを覚えていません。rcu_sched detected stalls
メッセージをデバッグするにはどうすればよいですか?
友達からサーバーがおかしな動作をしているというテキストが届きました。それで私はログをチェックしました、そして再び屋台があります。 最新のログ をアップロードしました。
Memtest86 +を実行したところ、何も見つかりませんでした。しかし、過去31日間のCPUグラフを確認したところ、興味深いものが見つかりました: サーバーが最初にpingに応答しなくなったとき、コア2のCPU負荷は低下しましたが、他のすべてのコアはアイドル状態でした。 CPU0の急上昇は最悪でした。
稼働時間レポート:10:05:05 up 27 days, 20:50, 1 user, load average: 0.23, 0.25, 0.18
しかし、GitLabをシャットダウンしました。 Debianで問題を引き起こしているGitLabの経験はありますか?
あなたのログに見られるように、あなたの問題はおそらくVirtualBoxGuestの追加がKVM VMマシンにインストールされていて、ある種の競合。
ややvboxdrv
カーネルモジュールがアンインストールされ、古いパッケージのkvm/virtioドライバーに取って代わられたように見えました私は思うそしてややそれは新しいものでは起こっていないようでしたなんらかの理由。
あなたが言ったように、あなたが私たちに与えているログの後で、あなたはVirtualBoxコンポーネントをアンインストールしました。
IMO、あなたは正しい行動を取りました。ここで、これが再び発生するかどうかを確認するために数日を与えます。
ログから、いくつかのNMIがありました。参照: https://en.wikipedia.org/wiki/Non-maskable_interrupt
ハードウェアも確認することをお勧めします。