Ks-softのAdvancedHostmonitorパッケージを使用して、ネットワーク上の約2000個のアイテムを監視します。それは素晴らしいと思います。それをサポートする章は素晴らしいです。製品は高速で安定していて成熟していますが、会社として成長するにつれて、バックオフィス管理システムとの統合の分野でいくつかの摩擦点を示し始めていると感じています。
私たちがやりたいことの1つは、APIを介して使用する監視ツールに新しいテストを追加できるようにすることです。たとえば、サーバーの注文が小売店のインターフェースから来ると、サーバーは自動的にビルドされます。自動ビルドプロセスの一環として、ネットワーク監視システムに新しいテストを自動的に追加したいと考えています。
Hostmonitorは、HM Scriptと呼ばれる機能を介してこれをある程度サポートしていますが、スピードバンプが発生し始めています-
私たちがhostmonitorで気に入っているのは、areアクションプロファイルです。たとえば、Windows IISボックスが悪くなった場合、悪いテストのアクションプロファイルは次のようになります。
私は他のネットワーク監視ツールを見回し始めており、探しています:
NagiosとIcingaを見てきましたが、これらの機能を使用できるかどうか、または可能であれば、実装/カスタマイズにどれだけの作業が必要になるかについて、ドキュメントから収集できないようです。
誰かがアドバイス、ガイダンス、または経験を提供できますか?
Icingaは非常にうまく機能します(データを取得するために使用できる単一のAPIがあり、Nagiosプラグインと100%互換性があるため、Nagiosよりも好みます)。
Nagios VS Icingaについてのビデオがあり、それをかなりよく説明しています: Youtube (Icingaによるので、注意してアプローチしてください)
Icingaを使用して、誰かに電子メールを送信/ SMSを送信したり、スクリプトを実行したりすることもできます(したがって、サービスを再起動し、再起動します...)例: Link (nagios-linkですが、同じ取引)。
私がよくわからないのは、コマンドを時系列で実行することだけです。
構成を簡単にするために、 NConf を使用します。ホスト、サービスなどのAPIを提供します(ユーザー管理用ではありません)。
環境によっては、プローブを使用せずにトラフィックを分析するだけのソリューションを検討し、500レベルのエラーやトラフィックが長期間急落した場合などに基づいてアラートを設定することをお勧めします。たとえば、ExtraHopが提供するものを見てください: http://www.extrahop.com/
OpsviewにはAPIがあります: http://docs.opsview.com/doku.php?id=opsview3.0:api
外部モニタリングをお探しの場合は、WatchMouseをご覧ください。彼らのAPIはあなたが言及する機能を提供します(私があなたが正しいと理解している場合): apidoc.watchmouse.com
乾杯マーク