OpenVZを使用していくつかのVPSに分割された3つの専用サーバーがあります。 muninを使用して本番サイトでVPSを監視し、VPSのいずれかを監視して、障害が発生したときにサービスが再起動することを確認しています。
最大14台のVPSがあるため、すべてのサーバーを監視するためのはるかに優れた方法が必要です。muninによって収集されたデータだけでなく、いくつかの追加の統計情報も表示できるセンターハブが必要です。私たちのサービスのネットワークとパフォーマンスについて。
要件の一部:
-SMS失敗の通知(特定のカスタム検証をセットアップする機能)
-Apacheerror_logおよびその他のログアナライザー。
-中央に配置する必要があります(1つのサーバーと複数のノードがデータを収集することを意味します)。
-インストールが簡単である必要はありませんが、保守が簡単です。
-無料である必要があります
Nagiosとsplunkを指摘されましたが、どう思いますか?ありがとう、
Xenが配置されていることを除いて、同様の設定があります。私は次の組み合わせに非常に満足しています:
監視設定を共有することがお役に立てば幸いです:-)
ここにいくつかの便利なリンクがあります:
http://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-1/index.html
https://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-2/
http://www.ossec.net/main/splunk-ossec-integration
更新:
Matt Simmons Nagios構成レイアウトも使用していることを忘れました。ここにあります http://www.standalone-sysadmin.com/blog/2009/07/nagios-config/
このレイアウトにより、Nagios構成が正常になり、保守がはるかに簡単になりました(Mattに感謝します)。
Zabbix で大成功を収めました。これは、1つのパッケージですべてのポイントを満たします。
(ソース: zabbix.com )
最も難しい部分はApacheログ監視を取得することですが、Zabbixは拡張可能であるため、LogWatchまたはその他のPerlスクリプトを使用してデータを取得できます。
私はOpManagerが好きで、特定の数のノードまで無料です。上記のすべてを実行し、インストールと保守が非常に簡単です。