web-dev-qa-db-ja.com

本番サーバーの監視

OpenVZを使用していくつかのVPSに分割された3つの専用サーバーがあります。 muninを使用して本番サイトでVPSを監視し、VPSのいずれかを監視して、障害が発生したときにサービスが再起動することを確認しています。

最大14台のVPSがあるため、すべてのサーバーを監視するためのはるかに優れた方法が必要です。muninによって収集されたデータだけでなく、いくつかの追加の統計情報も表示できるセンターハブが必要です。私たちのサービスのネットワークとパフォーマンスについて。

要件の一部:
-SMS失敗の通知(特定のカスタム検証をセットアップする機能)
-Apacheerror_logおよびその他のログアナライザー。
-中央に配置する必要があります(1つのサーバーと複数のノードがデータを収集することを意味します)。
-インストールが簡単である必要はありませんが、保守が簡単です。
-無料である必要があります

Nagiosとsplunkを指摘されましたが、どう思いますか?ありがとう、

18
Adam Benayoun

Xenが配置されていることを除いて、同様の設定があります。私は次の組み合わせに非常に満足しています:

  • アラート用のNagios(一部のライトグラフにはPNPを使用し、サービス状態ダッシュボードにはNagvizを使用)
  • Gangliaシステムの履歴グラフ化
  • [〜#〜] ossec [〜#〜]HIDSとして、また同様に重要なことに、集中ログのコレクターとして
    • 補足:これら2つのツールveryを統合するOSSEC用のSplunkプラグインがありますが、Splunkv4に移植されるのを待っています。
  • Splunk最後に、いくつかのSplunkプラグインが移行されたら、ログを事前にフィルタリングしてSplunkを使用する予定です(超過しないようにするため)無料版の上限)

監視設定を共有することがお役に立てば幸いです:-)

ここにいくつかの便利なリンクがあります:

http://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-1/index.html

https://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-2/

http://www.ossec.net/main/splunk-ossec-integration

更新:

Matt Simmons Nagios構成レイアウトも使用していることを忘れました。ここにあります http://www.standalone-sysadmin.com/blog/2009/07/nagios-config/

このレイアウトにより、Nagios構成が正常になり、保守がはるかに簡単になりました(Mattに感謝します)。

17
faultyserver

Zabbix で大成功を収めました。これは、1つのパッケージですべてのポイントを満たします。

alt text
(ソース: zabbix.com

最も難しい部分はApacheログ監視を取得することですが、Zabbixは拡張可能であるため、LogWatchまたはその他のPerlスクリプトを使用してデータを取得できます。

5
Dave Drager

私はOpManagerが好きで、特定の数のノードまで無料です。上記のすべてを実行し、インストールと保守が非常に簡単です。

2
ChickenMilkBomb

Nagiosは良い選択であるはずです。まず第一に、それはモジュール式であり、ほとんどすべての期待を満たします。その上、それはいくつかのニースを受け取りました

編集:チェックすることを忘れないでください この答え

1
minder