ダウンノードのすべてのチェックが停止するように(サービスが表示されないか、不明として表示される)、nagiosを微調整したいと思います。言い換えると、1(ダウン)+ n(サービスごとに1)ではなく、ダウンしたホストに対して1つのアラートのみを表示したいのです。通知をオフにするだけでなく、サービスdisplay/statusにも関心があることに注意してください。
理論的根拠:nagios firefox/chromeプラグインを使用してステータスを監視し、nagiosの動作はノイズが多すぎて、次のような読み取り値が得られます(すべてのノードに20のサービスがあるため)。
3 down, 1 unreachable, 4 warnings, 87 critical
これは、アップノード上の7つの重要なサービス(問題はサービスにあります)が、ダウン/到達不能なノード上にあるという理由だけで重要な赤いサービスのスラブに圧倒されていることを意味します。私がむしろ見たいのは:
3 down, 1 unreachable, 80 unknown, 4 warnings, 7 critical
あるいは
3 down, 1 unreachable, 4 warnings, 7 critical
私はサービスの依存関係を調べましたが、「すべてのサービスを稼働状態にする-ホストはホストチェックのステータスに依存する」と説明する方法を細かくしませんでした。
議論された問題を見つけました ここ 、参加者の1人がnagiosバグだと思ったところ、 ここ 参加者の1人が「設計どおり」だと思ったところ。
実は、私はその効果に興味があり、デザイン哲学には興味がありません。このnagiosは数百のノードをチェックしているため、ソリューションの保守性も重要であることに注意してください。
TIAと歓声。
Nagios/Icingaのデスクトップ(トレイ)ステータスモニターであるNagstamonの最新バージョン(0.9.11)を使用すると、これを非表示にできます:- http://nagstamon.ifw-dresden.de/
これを行うには、ステータスCGIビューでフィルターを適用します...
Chrome/FFプラグインはCGIからデータを取得しているだけなので、プラグインがクエリを実行しているステータスURLにこれらの同じフィルターを追加すると、表示内容を制御できます。
たとえば、ホストのみを表示したい場合:status.cgi?hostgroup=all&style=hostdetail
稼働中のホスト上の問題のあるサービスの場合のみ:status.cgi?host=all&servicestatustypes=28&hoststatustypes=2
使用する特定の値の詳細については、 フィルターに関するこのブログ投稿 を参照してください。 (それらはビットフィールドです。)
編集:これは、これらのボックスをチェックしたときにnagstamonが行っていることです。