web-dev-qa-db-ja.com

ksoftirqdの膨大な数のコンテキストスイッチ

重複の可能性:
うるう秒の間にLinuxサーバーが高率でクラッシュする人は他にいますか?

停止している2台のサーバーがあります。 1つはVMで、もう1つはベアメタルです。どちらも同様のコードを実行していませんが、同じネットワーク上にあります。ksoftirqdから非常に多くのコンテキストスイッチが発生しているようです(多くのCPUを使用しています)。

vmstat出力

procs -----------memory---------- ---swap-- -----io---- -system-- -----cpu------
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 1  0      0 605092 182496 2637556    0    0     0     0 4177 519187  8 19 73  0  0
 2  0      0 605092 182496 2637556    0    0     0     0 4792 520980  8 19 74  0  0
 3  0      0 605092 182496 2637552    0    0     0     0 2137 659640 18 26 56  0  0
 ...

pidstat出力

TCK4-BM-06A:~ # pidstat -w -I 5
Linux 2.6.32.12-0.7-default (TCK4-BM-06A)   07/02/2012  _x86_64_

03:03:01 PM       PID   cswch/s nvcswch/s  Command
03:03:06 PM         1      0.20      0.00  init
03:03:06 PM         4 386666.27      0.00  ksoftirqd/0
03:03:06 PM         6      0.60      0.00  ksoftirqd/1
03:03:06 PM         8 378213.17      0.00  ksoftirqd/2
03:03:06 PM        10      0.20      0.00  ksoftirqd/3
03:03:06 PM        12      0.20      0.00  ksoftirqd/4
03:03:06 PM        26 377115.37      0.00  ksoftirqd/11
03:03:06 PM        27      1.80      0.00  events/0
03:03:06 PM        28      1.00      0.00  events/1
03:03:06 PM        29      1.00      0.00  events/2
03:03:06 PM        30      1.00      0.00  events/3
03:03:06 PM        31      0.80      0.00  events/4
03:03:06 PM        32      0.80      0.00  events/5
...

私の最初の考えは、両方が同じネットワーク上にあるため、何かがネットワークにあふれているということです。これはデータと一致していますか?

1
Pace

うるう秒の質問と回避策については、次を参照してください。 うるう秒の間にLinuxサーバーが高率でクラッシュする人は他にいますか?

症状の1つが発生しています。

4
ewwhite