web-dev-qa-db-ja.com

監視サーバーをどのように監視しますか?

そのため、CentOSでGroundworks(Nagiosを使用)を実行して、さまざまなサーバーとプロセスを監視します。警告またはクリティカル状態に達したときにメールとSMSテキスト)を自動的に送信するように設定しています。通常、これは完全に機能します。ただし、Postfixが決定するサーバーでPostfixに問題が2回発生しました。メールの送信を停止します。誰も気づかなかったため、最新の時間は4日間続きました。

それは私に重要な質問につながります:監視サーバーをどのように監視することになっていますか?

14
organicveggie

もちろん、2番目の監視サーバーを使用します。 2番目の方法は、最初の方法を監視するだけなので、はるかに簡単です。もちろん、メインの監視システムによって順番に監視する必要があります。

あなたのグループが別々のITインフラストラクチャを持つより大きな組織の一部である場合、あなたは別のグループの監視サービスがあなたを監視するように手配することができるかもしれません。

また、サーバーが「大丈夫です」というメッセージを毎日送信し、それを探す習慣を身に付けることもできます。 (もちろん、これは、日常的なメッセージにまだ圧倒されていない場合にのみ効果的です。)

12
mattdm

他の人は、物事は大丈夫だという定期的なメッセージを送ることを提案しますが、個人的にはそれに同意しません。監視は、問題がない限りサイレントにする必要があります。また、「ああ、数日経っても毎日の電子メールが届かない」など、何かがおかしいことにユーザーが気付くことに頼ってはいけません。特に、アラートに応答する人が複数いる場合は、それぞれが、他の人が毎日の「大丈夫です」というメッセージをすでに削除していると考える可能性があります。

外部サービス(数百ありますが、 wormly を使用)を使用して、監視サーバーのHTTPチェックを実行し、サーバーが稼働していてインターネットに到達できることを確認します。それを監視するための私たちの主な関心事です。次に、NagiosサーバーはすべてのクライアントNagiosサーバーを監視します。

しかし、あなたは良い点を持ち出します。おそらく、接尾辞キューをチェックするHTTP URLを追加する必要があります。異常な数のメッセージが表示される場合は、キューにanyがあることを意味します。警告を発します。別のオプションは、アラートにさまざまな方法を使用することです。たとえば、SMTP以外のSMS配信エージェントと現在使用しているSMTP)などです。

しかし、私たちの場合、メールサーバーが停止したことはありません。もちろん、メールサーバーが使用されるのはNagiosアラートの送信だけなので、構成は非常に単純で、ほとんど変更されません。

14

もちろん、接尾辞も監視する必要がありますが、それは別のトピックです;)

私は Firefox用のNagiosチェッカープラグイン を使用しています。これは、私が定期的に使用するすべてのコンピューターのステータスバーで常に実行されています。

さらに、nagiosホストにpingを送信し、pingに応答しない場合はSMS)を送信するカスタムスクリプトが外部ホストにあります。

これまでのところ(5年以上)それはうまくいきました(木のノック)。

サーバー監視(この場合はnagios)を監視する場合、Pingdomまたはalertfoxの無料または基本的な計画が最適です。

2
BXAtWork

監視サーバーがインターネットから到達可能である場合は、外部プロバイダー(websitepulseなど)で監視する必要があります。

1
tex

まず、「私は生きています」というメッセージを1日1〜2回送信します。次に、この目的のためだけに古いマシンを実行します。このマシンには、別のGSMモデム、小型のUPSなどがあり、プライマリ監視サーバーへの専用(直接)接続があります。これは、ポイント3にも役立ちます。監視システムのステータスを定期的に確認してください。小さな補助監視システムは、私のオフィスのプライマリシステムのステータスページを常に表示します。

1
Sven