ここでは実際にはシステム管理者ではなく、一部の友人のためにサーバー(実際にはレンタルVDS)をセットアップしようとしています。
最近、基本的にゲームサーバー/ MySQL/Webサイトを1つのVPSから別のVPSに移行しました。新しいVPSには問題はありませんが、システムの負荷が急上昇し、両方のプロセッサを占有しています。以前のサーバーシステムの負荷の平均は約.3-.5です。前のサーバーはUbuntu 14にあり、そこからインストールしたパッケージのリストをエクスポートし、apt-getを新しいサーバーにインストールしました。また、古いサーバーのほとんどのファイルもrsyncしました(カーネルに干渉している何か悪いものをコピーしたと思います...)
とにかく、ここに私のuname -aの結果があります:
Linux ophq 3.19.0-18-generic #18-Ubuntu SMP Tue May 19 18:31:35 UTC 2015 x86_64 x86_64 x86_64 GNU/Linux
また、landscape-sysinfo/logging in screenの結果:
Welcome to Ubuntu 15.04 (GNU/Linux 3.19.0-18-generic x86_64)
System load: 2.13 Processes: 11
Usage of /: 22.6% of 196.64GB Users logged in: 1
Memory usage: 32% IP address for eth0: 123.123.123.123
Swap usage: 0%
(現在1つのゲームサーバーが使用されているため、メモリ使用量-デフォルト値からMinecraftに割り当てられるRAMの量を減らす必要があります)
トップの結果: http://ericbarber.me/serverproblem/top.png
これに追加するには、「Process Status」でFを押し、次にSを押して、「D」の下に2つのコマンドがリストされているトップリストを使用します... kworker/u30:0およびkworker/u30:1私のカーネルの仮定...
負荷平均が非常に高い理由に完全に困惑しています-MCサーバーとCS:GOサーバーの両方でユーザーをテストしましたが、遅延は発生していません-Webサーバーもテストし、ページを非常に高速に配信しています(古いサーバーと比較して。)
私はそれが割り込みの問題かもしれないと思ったので、ここにcat/proc/interruptsの結果があります:
http://ericbarber.me/serverproblem/interrupts2.png
これに加えて、別の質問でgrepを実行することが提案されました。 -r/sys/firmware/acpi/interrupts /および0を超える値を無効にします...ただし、残念ながらすべての値は0です。
上記と同じURL serverproblem/interrupts.png
Perfをインストールし、30秒の簡単なレポートを作成しましたが、この出力はあまり理解していません。
上記と同じURL serverproblem/perf.png
CPU情報は省略しますが、Intel Xeon CPU E5-2690、2コア、2 GB RAM、および500 GBハードドライブについて考えています。これが馬鹿げた質問であるか、以前に尋ねられた場合、私は謝罪します-私はこれに数時間取り組んでおり、Googleが過去ゼロからやり直している行き止まりに直面しています...避けたい。
リンクに関するおologiesび。新しいユーザーの制限。
編集:mpstatの結果を追加するには:
Linux 3.19.0-18-generic (ophq) 06/05/2015 _x86_64_ (2 CPU)
02:10:35 PM CPU %usr %Nice %sys %iowait %irq %soft %steal %guest %gnice %idle
02:10:35 PM all 7.28 0.00 1.72 47.13 0.00 0.09 0.53 0.00 0.00 43.24
これは結局、カーネルのバグだと思うものになりました。 4.0.0-040000-generic#201504121935に更新すると、ホストされているサーバーで何かが発生しない限り、ほとんどの場合、CPUの待機は正常になり、システム負荷は.10未満になりました。
とにかく、私は助けるために次のリンクを使用しました: http://ubuntuhandbook.org/index.php/2015/04/upgrade-to-linux-kernel-4-0-in-ubuntu/
ルールを遵守するために、ルートとして次のことを行ってからマシンを再起動しました。
wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.0-vivid/linux-headers-4.0.0-040000_4.0.0-040000.201504121935_all.deb
wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.0-vivid/linux-image-4.0.0-040000-generic_4.0.0-040000.201504121935_AMD64.deb
wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.0-vivid/linux-headers-4.0.0-040000-generic_4.0.0-040000.201504121935_AMD64.deb
dpkg -i linux-headers-4.0.0*.deb linux-image-4.0.0*.deb
update-grub
私がこれまでに来た方法については-無数のフォーラムやニュースグループ/メーリングリストを読んでどこにも行かなかった後(BIO、ブートオプション、commit = 60、サービスの無効化、物理サーバーの場所の変更などを試みました)カーネルをダウングレードまたは更新します... 15.04が新しいため、更新しました。この問題の他のレポートを見たことがないので、根本的な原因はまだわかりません。古い14.10システムからrsyncを使用したとき、間違ったドライバーがコピーされたか、カーネルファイルが間違っている-4.0.0がこれを修正する理由私...しかし、少なくとも5秒ごとにkern.logと私のハードドライブに書き込むkworkerはもうありません。
私は最近、14.10および15.04サーバーで同様の問題に遭遇し、安価なディスプレイアダプター(pny geforce 210 pci-E)にトレースされました。あなたの問題とは無関係かもしれませんが、私の箱からカードを取り出した後、それは私のためにきれいになりました
場合によっては、ハードディスクがボトルネックになり、システムの負荷が高くなる可能性があるので、調べてください。
これらのリンクをチェックして、これがあなたのケースの問題であるかどうかを調べるために使用できるツールに関するさまざまな提案を確認できます。
https://serverfault.com/questions/9428/how-can-i-monitor-hard-disk-load-on-linux