CentOS 6.9
今日、クライアントでの応答が非常に遅くなり始めたNFS(v4)ファイルサーバーがあります。これが発生している間、エクスポートされたボリュームはサーバー自体で遅くなりません。
上部は非常に高いCPL値(> 100)を示しています。そうでなければ、何も異常に見えません。
Nfsを再起動した場合(service nfs restart
)、CPL値はすぐに低下し始め、ボリュームはクライアントで再び応答するようになります。ただし、2〜3分後、CPL値は再び上昇し始めます。
nfsを再起動すると、dmesgにいくつかのメッセージ以外のメッセージが表示されません。
/ var/log/messagesには、関連性があると思われるものは何も表示されません
何が起こっているのかについて誰かが何か考えを持っていますか?
CPL CPU load information.
This line contains the load average figures reflecting the number of threads that are available to run on a CPU (i.e. part of the runqueue) or that are wait‐
ing for disk I/O. These figures are averaged over 1 (`avg1'), 5 (`avg5') and 15 (`avg15') minutes.
Furthermore the number of context switches (`csw'), the number of serviced interrupts (`intr') and the number of available CPUs are shown.
これからの重要なポイントはwaiting for disk I/O
。私は、クライアントがディスクで何かファンキーなことをしようとしていて、それが残りのクライアントの速度を低下させているに違いありません。使用されているネットワーク帯域幅の種類を確認しましたか?リンクは完全に飽和していますか?