監視ツールとその機能のより包括的なリストについては、 このWikipediaのページ をチェックしてください。
質問にあるように、このタスクに使用される最も一般的に使用されるツールは何ですか?それらの長所と短所は何ですか?
私は過去に Nagios を使用して成功しました。非常に拡張性が高く(200を超えるアドオン)、比較的使いやすく、多数のレポートがあります。マイナスは、初期設定です。
個人的に、私は Munin が大好きです。これは、非常に単純なアーキテクチャーであるため、インストールとプラグインの作成が非常に簡単です。想像できるすべての目的のために、すでに非常に多くのプラグインが存在しているので、おそらく最初からプラグインを作成する必要さえないでしょう。
また、美しいグラフと、(非常に基本的な)アラートを設定するオプションも提供します。
Zabbix 。オープンソースであり、セットアップとカスタマイズはかなり簡単です。 zabbixサーバーにフィードする多くのカスタム監視スクリプトがありますが、そのデータを一元化し、適切に表示し、通知(メール、IM、SMS、Twitterなど)などを処理します。
私は会社で Spiceworks のロールアウトを行っており、サーバーの監視だけでなくネットワーク上の他のすべての監視ツールとして優れていることがわかりました。
自動インベントリやカスタムモニタリングなどの問題が発生したときにメールを送信します(例:プリンターのインクが10%に低下している、またはこのサーバーのハードドライブに20%がある)。
その欠点はおそらく、コンピューターごとの情報の密度であり、コンピューターごとに大量のデータがあることを誤解しないでください。ただし、多くの統計情報が必要なサーバーなどでは、別のツールを使用する必要があります。
編集:ああ、私はそのビジネスモデルが永遠に自由であることをベースにしていると述べました。
Smokeping は、さまざまなサーバーやサービスの可用性をチェックするだけでなく、それらのレイテンシを追跡しながら、使いやすく、見栄えがよく、迅速な表示グラフ。
幅広いレイテンシ測定プラグインがそのまま使用できます。 Perlを知っている場合は、エキゾチックなニーズに合わせて独自のPerlを簡単に作成できます。
大規模な設置では、分散測定用のマスター/スレーブシステムが役立ちます。
高度に設定可能なアラートシステムは、ユーザーに影響を与えたり、大規模な停止に発展したりする前に、問題に気づくのに役立ちます。
Smokepingは無料で、MRTGおよびRRDtoolの作成者であるTobi OetikerによってPerlで記述されたオープンソースソフトウェアです。
OpenNMS は、1,000台を超えるLinuxマシンの監視に使用されている場合に使用されます。各マシンのハードウェアと、それらで実行されているアプリケーションを監視します。
Zenoss Core はある程度役に立ちますが、サーバー、ネットスイッチ、UPSの軽量監視に(約1年間)使用しています。
Zenoss Coreは、受賞歴のあるオープンソースITモニタリング製品であり、単一の統合ソフトウェアパッケージを通じてネットワーク、サーバー、アプリケーションの構成、ヘルス、パフォーマンスを効果的に管理します。
私は使用しました:
Nagiosは無料で、たくさんのプラグインがあるので素晴らしいです。ただし、UIと構成は非常に困難です。
これは、プロ/コンで正反対です。これは、Microsoft System Center Operations Manager(SCOM)でも優れています。これは、無料ではなく、プラグインの数は少なくなりますが、セットアップと構成は見事で簡単です。
私が主にMicrosoftの会社に所属していたか、非常に高い信頼性要件を持っているか(つまり、監視を中断する余裕がない)、または開発者にそれを使用することを検討する必要があった場合、SCOMがNagiosに対する私の推奨になるでしょう。
私たちはAlertFoxを数週間使用しており、とても満足しています。稼働時間とパフォーマンスをチェックするだけでなく、トランザクションスクリプト(iMacrosベース)を介してショッピングカート、ユーザーログイン、およびWebサイトの他の重要な部分も監視します。
内部監視(ディスク領域など)にはNagiosを使用します。
PRTGネットワークモニター-それについて十分な素晴らしいことを言うことはできません。素晴らしいWebフロントエンド。特に、SNMPを介してルーター(帯域幅など)およびその他のデバイスを監視し、SLAの稼働時間などを測定するのに最適です。
www.paessler.com
Windowsの人として、MOM。 Systems Center Operations Manager(SCOM)へのアップグレードを検討していますが、Windows 2008の展開を開始するまで必要はありません。
統計(メモリ使用量、負荷、mysqlアクティビティ、Apacheアクティビティなど)を監視するために Munin を使用します。箱から出してすぐに、多くのことを追跡し、さまざまな時間間隔(過去24時間、過去7日間、先月、昨年)のグラフをプロットします。プラグインにより、さらに多くのものを監視できます。その出力はきれいなグラフのHTMLページです。
Muninにはマスター/ノードアーキテクチャがあります。ノードはサーバーで統計を収集し、マスターはデータを保存してHTMLとグラフを生成します。
私は Monit を使用して、実行中のプロセスを追跡し、特定の構成可能な条件(高CPU負荷、高メモリ使用量、HTTP応答なしなど)が発生したときに再起動または警告します。Monitは、より一般的なものも監視できますCPUの負荷、メモリの使用状況、ハードディスクのステータス、ディスクの使用状況など、サーバーについて。
監視するすべてのサービスまたはハードウェア、および問題が発生した場合の対応方法について、Monitを構成する必要があります。最も使用されるオプションは、何もしない、警告メールを送信する、またはサービスを再起動することです。
Monitは機能する場合は優れていますが、サービスの開始、停止、または再開に失敗する場合があり、何が問題であるかを通知する診断情報が多くありません。これは、問題がサービスにあるのか、cronのような最小限の環境で実行されるMonit構成にあるのかがわからないことを意味します。
ほとんどのLinuxディストリビューションでは、どちらのツールもデフォルトで使用できます。
私は運用監視のアップグレードプロジェクトに参加しています。いくつかの大きなドルのシステムを提示するためにさまざまなベンダーをオンサイトに訪問させ、比較するためにいくつかのより安価な代替品を混ぜてきました。
その1つは Hyperic で、これは無料のオープンソースソリューションとしても利用できます。カスタムエージェントの機能と拡張性の提供に感銘を受けました。
logwatchまたはlogcheckのLinuxサーバーについて誰も言及していないことに驚いています。
サーバーの監視に Pingdom を使用しています。サーバーにアクセスできない場合、SMSメッセージが送信されます。
それはすべて、「モニター」が何を意味するかによって異なります。
CactiおよびRRDToolベースのソリューションとの競合をチェックするシーンの新規参入者は、Graphite( http://graphite.wikidot.com/ )です。
RRDToolは、Whisperと呼ばれるバッキングストアに置き換えられます。ドキュメントはそれがなぜ異なるのかについてのかなり良い概要を提供し、私は何かを調査するときのアドホックなグラフ作成のためのCLIが本当に好きです。
急いでいて、MSサーバーを監視する簡単なツールが必要な場合は、Windowsのパフォーマンスモニターを使用して、カスタムモニタリングテンプレートとカスタムスケジュールでカウンターログを設定します(例:1時間ごとに5分間データを収集)。次に、MicrosoftのLogParserとCodeplexのログのパフォーマンス分析(PAL)ツール( http://pal.codeplex.com/ )をダウンロードして、カウンターログをクランチします。 PALは、問題を解決できる可能性のあるドキュメント/ツールへのリンクを含む、優れたドキュメント化されたレポートを生成します。
Nagios Webインターフェースが気に入らない人のために [〜#〜] npc [〜#〜] があります。これは、Cacti内からNagios UIを利用できるようにするプラグインですが、見栄えがよくなっています。 (ajaxなど)。
NDO2DB によって提供されるデータベースから読み取ります。これは、スクリプトやその他のツールで使用するためにデータベース内からインフラストラクチャを利用できるようにする優れた方法です。
ホビット-これはビッグブラザーのより高速なバージョンです(最近、驚くほど商業的になっているようです)。
現在、PRTGは Paessler から使用しています。それは素晴らしいです。エージェントは不要、優れたAjax Webインターフェース、履歴ログ、グラフ、WMIなど。10個のセンサーバージョンが無料で利用できますが、エンタープライズバージョンにはいくつかのグランドバージョンが用意されています。よく使われたお金。
Nagiosの上で実行される OpsView を使用します。 webUIは、SSHアクセスを許可せずに新しいホストモニター定義を展開し、パブリックビューを提供し、履歴値を記録するのに役立ちます。これは、適切なベースラインのプロビジョニングと決定に役立ちます。
Zabbix( http://www.zabbix.com )も、Nagiosよりも設定が簡単です。
私は、Solarwinds、VMwareサーバーのパフォーマンスタブ、およびカスタムスクリプトを組み合わせて使用しています。
Solarwinds Orion Network Performance Monitorは、Windows sysで使用しています。私のWebサーバーの管理者。それでもいくつかの有用なアプリメトリックが実行されていますが、基本的なボックスレベルのもの(ディスク、ネットワーク、CPU)についての良い情報があります。
VMwareのゲストにとって、私はパフォーマンスタブが大好きです。
私のSunサーバーでは、Solarwindsで利用できないものが必要な場合(管理者が追加していないため)、ミラーの状態やスワップの使用状況などを監視するカスタムスクリプト(通常はPerl)を作成します。
私はソーラーウィンズをもっと利用したいのですが、1日は26時間しかない(または上司が信じている)ので、少し制限になる可能性があります...
PAサーバーモニター を使用しています。一部の限定されたSNMPサポートが追加されたため、他のシステムで改善されていますが、主にWindowsに焦点を合わせています(イベントログ、パフォーマンスカウンター、サービスなど)。私が一番好きなのは、多くのアプリに比べて構成が簡単なことです(構成ファイルやコマンドラインなどはありません)。ただし、重い* nix環境ではお勧めしません。
ああ、それは無料ではありませんが、いくつかの競合他社よりも安価です。
申し訳ありませんが、多くのカスタムスクリプトを使用してしまいました。理想からは程遠いものの、もっと一般的な解決策はないと思います。
独自の監視ソフトウェアを作成しました。私たちのコードは商用パッケージほど洗練されていませんが、あまり機能を必要としませんでした。他のパッケージを調べて、それらの使用方法を学ぶよりも、独自のものを書く方が簡単でした。コードは私たちが望んでいることを実行するだけで、簡単に拡張できます。
HPサーバーの場合、Systems Insight Manager(SIM)、たくさんの素敵な低レベルカウンターやアラートなどに勝るものはありません。GUIも悪くはありません。サポート契約へのリンクは、それだけで努力する価値があります。
私は Pandora FMS を使用してきましたが、それは非常にflexibleおよび平均的なシステム管理者のための簡単な構成。また、すべてのレポートと詳細なドキュメントを備えたWebインターフェイスが好きです。単一のデータセンターにはあまり役に立ちませんが、監視されているエージェントの位置を示すgeolocationインターフェースは非常に優れています。
私もNagiosを試しましたが、それが持っているすべてのプラグインが好きです、それはシステム管理者の間でよく知られています。
注:私はしばらくの間、Pandora FMSの開発者の一人でした。
常時オンラインではないがメールを送信したりダイヤルインしたりできるシステムを監視する必要があるため、カスタマイズ可能なものが必要でした。
Nagios(スクリプトの迷路)、AppManager(ナイスですが、変換できません)、Zenoss(ナイスですが、Oracleについて言及すると、価格はかなりの乗数になります)を試し、オープンプロトコル、オープンデータベース構造、一体、Zabbixに着陸しました。 1時間ですべてのレベルのプラグイン。うまく区分けされています(サーバー、クライアント、データベースなど)。そして、それはウェブのフロントエンドはかなり素晴らしいとカスタマイズ可能です。
YMMV、私たちにとって「オフライン」システムの監視は重要であり、通常はそのようなソフトウェアではカバーされません。
私はポリモンを使用していて、大好きです。
http://www.codeplex.com/polymon
TCPポート、SNMP、Powershell、WMI、SQL、HTTP、Perfmon、またはPingで通信できるものを監視するのに最適です。
私は何も* nixを監視していないので、それについて話すことはできません。しかし、Windowsの世界では、設定が非常に簡単で、非常に直感的で、非常に柔軟です。ダッシュボードの表示、SMS、電子メール通知などが組み込まれています。
非常に安価な「Servers Alive」の使用を開始したばかりですが、見た目は美しくありませんが、さまざまなチェックをサポートし、いくつかの方法でアラートを送信したり、技術者のスケジュールやロスターなどを処理して通知を受け取ったりできます。チェックを他のものに依存させることもできます。つまり、「この」システムでは「それ」が稼働している必要があります。
Windowsの場合:Admin Arsenal(ただし、それは私たちが製品を所有しているという前提で与えられています)
Unixの場合-IBM Tivoli
NagiosとNagvisを組み合わせたもの(監視を示すグラフィック)
メール、グーグルトーク、ツイッターにリンクされているので、監視を逃れることはできません
その素晴らしいFirefoxプラグインさえありました
サーバーとサービスのステータス(稼働中か停止か、およびダウンした場合に警告を送信する)とはい/いいえの質問(「過去24時間にバックアップが行われたか?」)には nagios 。セットアップは難しいですが、非常に構成可能です。カスタムスクリプトはリモートコンピューターで実行できます。アラートは、電子メールを送信したり、テキストメッセージを送信したり、カスタムスクリプトを実行したりすることもできます。
サーバーの健全性のために munin を使用します-メモリ使用量、CPU使用量、ネットワーク使用量などの素晴らしいグラフを提供します。少なくともLinuxでの設定は非常に簡単です(私はWindowsで試したことはありません)。
私は 10-Strike Network Monitor を使用しています
これは24時間年中無休のサービスとして機能し、LAN内の各デバイスを定期的にポーリングすることにより、ネットワーク内のすべてのデバイスを監視します。また、デバイスやサービスのオン/オフなど、特定のイベントに対するプログラムの応答を設定することもできます。プログラムは、メッセージの表示、サウンドの再生、外部プログラムの実行、ログへのレコードの書き込み、SMSの送信、サービスまたはコンピューターの再起動/シャットダウンなどを行うことができます。
サーバー監視Bijk.com- http://www.bijk.com を数週間前に使い始めました。
シンプルなインストール、非常に簡単なGUIとメンテナンスに満足しています。メールとSMSアラートは無料で利用できます。
Orca を使用してシステムを監視します。それは非常にきれいではありませんが、他の監視システムが使用しない大量の低レベルの詳細を提供します。
Dell OpenmanageおよびMS Scomと組み合わせたSolarwinds Ipmonitor。
私はNagios、Cacti、カスタムスクリプト、および自分のプロジェクトの1つを組み合わせて使用します システムヘルスモニター 。外部サービスの監視とシステムリソースのグラフを使用して、システムの問題の事後分析を行ったり、グラフをすばやくチェックして、過去の値と比較して「正常」に見えるかどうかを確認したりできます。
貧しい(安い)組織で働いているときは、ホビット、ビッグブラザー、ナジオを使用しました。 3つのうち、私はホビットが好きです。シンプルで防弾仕様だからです。 nagiosはopenviewまたはtivoliのオープンソースバージョンを目指していると常に感じていましたが、率直に言って、openviewやtivoliのようなフレームワークの構成に費やす時間があれば、監視はおそらく私の仕事全体であり、私の組織はおそらく余裕がありますopenviewを購入するのに、なぜnagiosを使うのですか?
IpswitchのWhatsUp Gold
OPManager(ポート、HTTP Getリクエスト、ICMP、SNMP(ディスク/メモリ/ CPU))(個人的なお気に入り!) http://www.manageengine.com/network-monitoring/
OpManagerは、管理者が完全なITインフラストラクチャを検出、マッピング、監視、管理するのに役立つ、受賞歴のあるネットワーク監視ソフトウェアです。
Cacti(SNMPグラフ、トラフィック、ディスク使用量、CPU使用率など)( http://www.cacti.net )
サボテンについて。 Cactiは、RRDToolのデータストレージとグラフ機能を活用するために設計された完全なネットワークグラフソリューションです。
PRTG(Paessler、残念ながらもう利用できません)
SmokePing:(パケット損失とレイテンシ) http://oss.oetiker.ch/smokeping/
Pingdom: http://www.pingdom.com
私はnagiosとhobbit(bigbrotherオープンソース実装)を独立して使用していて、正と負の両方の性質があることを発見しました。
nagios:
pro:通常の間隔でタスクを実行するための素晴らしいサブ分のスケジューラがあり、起動するための組み込みのPerlインタープリターがあります。
con:configは、アプリケーションの「機能」に基づいているが必ずしも単一のホストに分離されているわけではないテストを実行したい場合に、すべてのテストに対して「サーバー」を要求します。これを克服するために実際のnagios設定を生成するmeta-configに戻します。
ホビット:
pro:データをポーリングするbbクライアントの 'dboard'コマンドとの元の兄貴の簡単な統合で使用される大規模なスクリプトの代わりに、オープンソースのコンパイルされたサーバー。
con:「サーバー指向」の考え方にもこだわっており、ほとんどの人には当てはまりますが、私には当てはまりません。
私たちは試しました Applications Manager その実行Javaおよびmysql。ブラウザから非常に強力で簡単に構成できます。それほど高価ではありません。
現在、MSのSCOMを使用しています。誰にもお勧めしません!
IBMのディレクター、Dells Openが管理し、「金をいただきました」
HP SiteScope についてまだ誰も言及していません。
AlertGrid を使用していますが、これはWebアプリに最適です。何百万もの典型的なドットコムモニターとは異なり、外部からのパフォーマンス(応答時間など)を監視しませんが、アプリの内部からイベントを送信することで、コードの実行とすべてのカスタム指標/統計を追跡できます。アプリからAlertGridにイベントを送信し始めると、Niceビジュアルエディター(100%ウェブ)を使用してすべてを設定でき、技術者以外のユーザーも簡単に独自のアラートルールを作成できます。電子メール、SMS、電話、Webhookのアラートを利用できます。
サービスとしてインストールされ、バックグラウンドで実行され、CPU使用率、空きRAMの割合、および実行中のプロセスに関するイベントを発行する、シンプルなサーバー監視(Windows)用のプラグインがあります。セットアップには30分かかります。唯一の注意点は、マシンがインターネットに接続している必要があることです。
このタスクには Level Platforms を使用します。 sysadminsに過負荷をかけることなく大量の有用な情報を提供し、サーバールームのすべてのハードウェア(および多くのクライアント)を非常に簡単に処理できるようにします。
私たちはipswitchのWhatsUpを使用しています。小規模なネットワークのセットアップは非常に簡単で、ポートスキャンによってネットワークを自動検出でき、windowsとSNMP資格情報を使用できます。
Cpu、mem、diskなどの静的なモニターでは、SNMPをセットアップする必要があります。 WhatsUpはSNMP v1、v2、v3をサポートしています。
WhatsUpには、syslog(Unix)、イベントビューア(Windows)、SNMPトラップによるパッシブモニターがあります。
カスタムユーザーとカスタムワークスペースを備えたNice ajax Webインターフェイスがあります。
P.D.私の悪い英語でごめんなさい
Ground workを試してください。Nagiosを使用しています。したがって、nagiosのすべての機能を備えており、nagiosだけでは不可能であるWebインターフェースを介してグラフィカルにモニタリングを編集できます。 https://kb.groundworkopensource.com/display/SUPPORT/Home
hyperic を使用します-オープンソースバージョンと商用バージョンの両方があります
オペレーティングシステム(RHES 3、4および5 + Ubuntu)、Apache、MySql、JBoss、Tomcat、メールサーバー、memcachedを監視し、おそらくより多くのアプリケーションを監視できます。特別な構成は必要ありません。すべてのサーバーは、従来とは異なる場所にインストールされている場合でも、自動検出で見つかりました。それは非常に使いやすく、設定が簡単で、サービス(開始/停止など)を制御し、アラートを定義できます。
マイナス-起動時に実行するように構成する必要があります(私たちはcronを使用して実行しています)。
誰かがping間隔を介した簡単なオン/オフ監視ツールとしてNetgongに言及する必要があります。
ServersAliveは、TCPサービス、Windowsサービス、独自のカスタムスクリプトなど、あらゆる種類のポーリングを行うための比較的安価でシンプルなツールです。開発者からの応答彼のメーリングリストは迅速で個人的なものです。
以前のジョブでサービスの監視に使用しましたが、信頼性が高く、カスタマイズ可能で、安価でした。
Ipswitch whatsup gold 12を使用して、パフォーマンスとtcp/ipまたはwmiベースのモニター、およびWindowsとlinuxの両方の約2000台のデバイスを監視します。それの良いところは、使いやすく設定が簡単で、一括変更オプションと自動検出、複数の通知方法があることです。悪い面:パフォーマンスが遅くなった後、約2000台のデバイスの制限があったようです。また、Windowsでのみ実行されます。配布されたバージョンは、実際には名前と値札に値しません。 nagios(動的環境にはセットアップが複雑すぎる)、zenoss(動的な環境には大きすぎる変更や自動検出がない、あまりにも制限されている)を評価し、現在、Zabbixを調べています。プローブとサーバーを備えた分散アーキテクチャ、比較的シンプルなセットアップ、オープンソースのバックエンド(mysql、Apache)...
EventLog Analyzerは、Webベースのリアルタイムのエージェントレスのイベントログおよびアプリケーションログ監視および管理ソフトウェアです。イベントログアナライザーソフトウェアは、収集、分析、レポート、アーカイブ、分散Windowsホストからのイベントログ、分散UnixホストからのSysLog、ルーター、スイッチ、その他のSysLogデバイス、アプリケーションログIIS Webサーバーから、IIS FTPサーバー、MS SQLサーバー、Oracleデータベースサーバー、DHCP WindowsおよびDHCP Linuxサーバー。イベントログアナライザーアプリケーションは、ネットワークパフォーマンスへの影響を最小限に抑えてシステムの問題を分析するのに役立つグラフとレポートを生成します。
現在、Groundworks Open Source Community Edition 5.3を使用していますが、そのバージョンではサポートが途中で落ちています。 GWOS 6にアップグレードするか、Zabbixまたは同様のオープンソースシステムに出荷する可能性があります。私はNagiosに基づいたものを好む傾向がありますが、それらの相互依存するすべての構成ファイルを管理するという悪夢のため、Vanilla Nagiosには向いていません。
GroundworksのWMIモニタリングプラグイン NRPEはかなりうまく機能します。 Nagiosは、NRPEを使用してウィンドウボックスでWMIサービスチェックをトリガーし、次に、他のウィンドウボックスのWMIクエリを実行します。これにより、WindowsボックスにNRPEエージェントを配置する必要がなくなり、* NixでNagiosを実行してWindowsで認証しようとするという悪夢も回避できます。
別の素晴らしいオプションは、ベースビルドの一部としてWindowsボックスにSNMPを設定することです。 SNMP( SNMPTools )を介してWMIチェックを公開するためのオプションがいくつかあります(ただし、これを各Windowsボックスにインストールして、エージェントレスではないようにする必要があります)。
Windowsログを監視し、特定のイベントが発生したときにSNMPトラップを送信できるWindowsツールがいくつかあります。
私たち IPチェック PRTGに名前が変更されました。これにより、あらゆる種類のさまざまなアクティビティを監視できるさまざまなセンサーが可能になります。
MSPセンター(以前のOpManager)を使用するのは本当に面倒で、お勧めできません。インターフェースは完全にウェブベースです。つまり、何かをやりたいときはいつでも、フィードバックはゼロであり、任意に選択できる選択肢が限られています。彼らのウェブサイトはヒントとドキュメントでいっぱいのようですが、それはOutlookに少し似ています-それはたくさんの力を約束しますが、一部の開発者の限られた想像力によって妨げられています。
ヘルプデスクの構成不要のソリューションを探しているなら、たぶん、それは一種のパワーツールではありません。ニーズに合わせてモニタリングを調整する時間がある場合は、努力に報いる他のソリューションがあります。
ログファイルを監視するための非常に優れたマルチテール。 nagiosがサービスの稼働時間を監視します。帯域幅を監視するためのrrdtool。
IpswitchのWhatsUp Gold
Argent Guardian もご覧ください。これはクロスプラットフォームであり、syslogサーバーとして機能できます。必要に応じて、独自のレポートを作成するためのデータベーススキーマを提供します。また、独自の画像を「マップ」としてインポートして視覚的なアラートを提供できます。
NagiosとHPOpenviewは、私が精通していて経験豊富な2つです。どちらも良い選択ですが、後者の場合は、正しく実行する方法を知っている人が必要であることを他のポスターに反映します。ここでも、HPを使用しているときだけが動作しているのを目にしたので、それが私の認識を助けたのかもしれません。
私は多くの場所で多くの監視システムを使用してきました。それらのほとんどはすでに言及されています。まだ行っていないものをいくつか紹介します。
SMARTS-現在EMCが所有しています。本当に根本的な原因のためにこれまでで最高のものです。それは安価ではなく、サポートはEMCが所有しているため、もはや良いものではないかもしれません。幸運にも、会社の創設者と協力して実装を実現することができました。
ビッグブラザー。素晴らしくシンプルですが、悪いライセンスです。これは私が今まで見た中で最も醜いWeb GUIでもあるので、書き直さなければなりませんでした。ビッグシスターを働かせたことはありません。
HP Openviewは、有能なエンジニアによって設計、インストール、実行された場合、優れている場合があります。しかし、私はそれが正しく行われたこと、そして私が覚えているよりも頻繁に間違ったことを見ただけです。私はそれを使うことを決して選びません。
BMCパトロール。ひどい。死ぬ!
そして最後に、ログと問題の追跡には、Splunkを使用する必要があります。これが約10年前だったとしたら、私は多くの無駄な時間を節約できただろう。
Nagiosの上に下地が付いています。
基礎知識が役立つか妨げるかはわかりませんが、nagiosは間違いなく優れています。
私はActivexpertsネットワークモニターを使用して大きな成功を収めています(ほとんどがWindowsネットワーク上ですが、いくつかのUNIXおよびLinuxホスト、さまざまなブランドのプリンターなどがあり、これらもモニターされていました)。
セットアップと学習は非常に簡単で、入手したものに対してかなり安く(サイト/エンタープライズライセンスは500ドルでした)、vbscriptとリモートのUNIXコマンドをサポートしています。ネットワークが小さい場合(せいぜい数百のノード)、これは巨大なWindowsネットワークのみに向けられていると感じるSystem Center Operations Managerよりもはるかに直感的だと思います。
ネットワークモニターには、さまざまなExchangeバージョンとそのすべてのサービスを含む電子メールサーバー、予想される応答、イベントログ、SQLクエリ、予想される応答などを含むhttpサーバーを監視するための多数の定義済みスクリプトが付属しています。構成する(「これらはすべてこのルーターに依存しているので、pingとsnmpに応答できない場合は、その背後にある応答しないものすべてについてわざわざ警告しないでください」)。 SMSゲートウェイまたはローカルGSMモデムをサポートし、すべてのルールにサービスの再起動、サーバーの再起動、カスタムスクリプトなどのアクションを含めることができます-再発する問題を修正するために重要です(重要なのは、回帰のようなものです)テストは開発用です)。
...私もホビットを飼いならそうとしましたが、本当に楽しんでいませんでした(Windowsエージェントの肥大化もありませんでした)-Windowsサーバーの監視用にセットアップされており、実際に打撃を与えています-おそらくLinuxまたはUNIX中心のネットワーク。
Sysmon を何年も使用しています。監視しない最新のサービスはいくつかありますが、ほとんどの* nixプラットフォームで簡単にコンパイルされ、ほとんど依存しない依存関係があり、非常に軽量です-非常に多くのデバイスとサービスを簡単に監視でき、複雑なネットワークレイアウト(リングトポロジを含む)とフェイルオーバー監視を処理できます。基本的には設定ファイルの取引ですが、フォーマットはかなり簡単です(plist/cssに基づく)。
Verax NMS を確認してください。利点: