Amazon EC2で実行中のインスタンスをウェブサーバーに切り替えました。
今、私はcloudwatchを見ていましたが、それがその仕事に適切なツールであるかどうかはわかりません。基本的に、何らかの理由でサーバーがダウンしたときに通知を受けたいと思います。
サーバーがハッキングされたか、何らかの理由でサーバーがシャットダウンした可能性があります。通知を受け取りたいと思います。
私はclouwatchを有効にしてアラートを設定しようとしましたが、ネットワーク入出力やCPU使用率、Dメトリックなどしか表示されません。今、私はこれらがうまくいくかどうかわかりません。
1つの推奨事項は、CPU使用率などの常に数値を持つメトリックを監視し、メトリックの状態が「データが不十分」である場合にアラームをトリガーすることです。これは、Amazon SNSを使用して通知できます。
または、特定のサービス(httpd、mysqlなど)のバイナリ状態を返すカスタムメトリックを設定し、これらのいずれかが0を読み取るたびにアラートを生成できます。このアプローチは、より詳細な可能性を提供します-「不十分なデータ」と組み合わせる'すべてのケースをカバーします。
実際にサイトを監視するもの(Pingdom、UptimeRobotなど)を使用すると、より成功する可能性があります。
OpsGenie( http://www.opsgenie.com )を使用して、CloudWatchのリッチアラートを送信できます。 Currenly CloudWatchには、SNSメカニズムを介した電子メールおよびSMSを含む)アラートメカニズムの限定されたセットがあります。
OpsGenieウェブサービスAPIを呼び出すようにCloudWatchを設定し、受信者の好みに応じて、iPhone/Androidアプリへのプッシュ通知、SMS、音声通話などを介して適切な人々に迅速に通知することができます。
詳細については、次のブログ投稿をご覧ください。
http://www.opsgenie.com/blog/2012/09/04/aws-cloudwatch-alarms-on-your-mobile-with-opsgenie.html
Cloudwatchでアラームを作成し、「データ不足」状態になったときに通知するようにアラームを設定できます。すでに利用可能なメトリックのほとんどは、VMホストからのものです。これは、マシン内で何が起こっているかについて実際の考えを持っていません。
最初に、インスタンスにAmazonツールをインストールし、何か(すべて:CPU使用率など)を報告するスクリプトを設定し、そのメトリックがデータの送信を停止した場合に警告する(つまり、メトリックが不十分なデータ状態になる)ことをお勧めします)。
これは最低限必要なことですが、始めるのに適しています。
Cloudwatch開発者ガイドのモニタリングスクリプトのセクションを参照してください: http://docs.amazonwebservices.com/AmazonCloudWatch/latest/DeveloperGuide/mon-scripts.html
Route 53とその「ヘルスチェック」を使用できます。これにより、SNSアラートを送信し、ユーザーを別のセカンダリWebサイトまたはエラー画面にリダイレクトすることもできます。私はこれがあなたの問題よりもCloudwatchより良い解決策だと思います。
EC2ステータスチェック を実装できます。 EC2ダッシュボードから実行されます。インスタンスに移動し、インスタンスを選択し、ステータスチェックタブを選択します(インスタンスの説明の横)。ステータスチェックアラームの作成をクリックします。一時的な問題が発生しないように、間隔は常に1よりも大きい値に設定しています。
EC2を 自動回復 に設定することも可能です。これは、何らかの理由でインスタンスがダウンした場合に発生します。
二次監視システムもお勧めします。ダムはこれに適しています。別のホストから自分のWebサーバーを指すようにLinuxユーティリティmonを設定しました。 200応答コードを2回続けて取得できない場合、電子メールが送信されます。
APIやWebサイトなどのHTTPエンドポイントを監視する場合は、Route 53ヘルスチェックでそれを達成する方法についてのブログ投稿をチェックしてください(DNSにRoute 53を使用していない場合でも)。
http://eladnava.com/monitoring-http-health-email-alerts-aws/