Muninサーバーとアラートをセットアップし、それらもテストしました。ディスク使用量のアラートを以下のように設定しました。
df._dev_mapper_centos_root.warning 90
df._dev_md126p2.warning 90
df._dev_md126p1.warning 90
df._dev_mapper_centos_home.warning 90
私は私の電子メールで上記のアラートを受け取りました(テストのために私は低い値を維持しました):
> sha :: Server2 :: Disk usage in percent
> WARNINGs: /boot is 33.48 (outside range [:33]), / is 17.95 (outside range [:17]), /boot/efi is 4.73 (outside range [:4]).
>
> sha :: Server1 :: Disk usage in percent
> OKs: /boot is 33.48, / is 17.95, /boot/efi is 4.73
現在直面している問題は、ディスク遅延アラートが表示され、アラートを変更するための値が見つからないことです。 Muninによってトリガーされるアラートは次のとおりです。
> sha :: Server1 :: Disk latency per device :: Average latency
> for /dev/centos/swap
> WARNINGs: Write IO Wait time is 4.89 (outside range [0:3]).
>
> sha :: Server1 :: Disk latency per device :: Average latency
> for /dev/centos/home
> WARNINGs: Write IO Wait time is 10.64 (outside range [0:3])
。
このサーバーにはデバイスあたりのディスク遅延のグラフが表示されていますが、ノードにTelnet接続すると、値を取得するためのプラグインが表示されません。
telnet 192.168.10.252 4949
Trying 192.168.10.252...
Connected to 192.168.10.252.
Escape character is '^]'.
# munin node at localhost.localdomain
list
acpi cpu df df_inode entropy exim_mailqueue forks fw_conntrack
fw_forwarded_local fw_packets hddtemp_smartctl if_enp2s0 if_err_enp2s0
interrupts irqstats load memory netstat open_files open_inodes
postfix_mailqueue proc_pri processes swap threads uptime users vmstat
適切に説明したかどうかはわかりませんが、ばかげた質問だと思うとすみません。これらのアラートを完全に停止するか、値を高く設定します。ここで助けが欲しいと思います。
おそらくdiskstats_latencyプラグインです。次のことを試してください。
diskstats_latency.centos_home.avgwrwait.warning 0:15
diskstats_latency.centos_home.avgrdwait.warning 0:15
diskstats_latency.centos_swap.avgwrwait.warning 0:15
diskstats_latency.centos_swap.avgrdwait.warning 0:15
これは、書き込み(avgwrwait)と読み取り(avgrdwait)の両方のレイテンシーであることに注意してください。
範囲を0:15に設定します。これにより、警告がほぼ完全に無効になります。
Muninデーモンを再起動することを忘れないでください
systemctl restart munin-node