Nagiosを使い始めたばかりで、チームが問題を認識できるのが好きですが、問題を修正するために使用されるソリューションをログに記録する方法がまだ見つかりません。 Nagiosアラートをログに記録し、事後分析とログソリューションを完了して、誰かが同様の問題に遭遇したときに、ログに記録されたデータを参照できるようにするツールはありますか?
正直なところ、障害時にこの情報を取得しようとしても役に立たないと思います。あなたはストレスを感じており、おそらくまだ眠いです。少なくとも、良いドキュメントを書くのに役立たない「戦うか逃げるか」モードになります。 Nagiosには、サービスにクイックノートを記録する機能がすでにあります(ackの一部として、またはサービス/ホストに添付する別のノートとして)。これらは、緊急事態の後に余暇に行う必要のある事後分析の一部として使用でき、その後、Wikiにキャプチャされ、サービス自体からリンクされる、より構造化された、便利で、より適切に記述されたドキュメントに組み込まれます。 Nagiosで(notes_url
フィールドを介して)。
私が働いている場所では、その逆を行っています。
「TopDesk」と呼ばれるチケットシステムを使用します(実際には問題ではありません)。 Icinga(nagios-fork)にアラートがあるときはいつでも、これはTopDeskサーバーへのHTTPリクエストを介してチケットを作成します。
したがって、nagiosにメール、SMS、チケットシステムを介して警告/エラーを送信させ、それを使用して実行されたアクションを追跡する方が簡単だと思います。