web-dev-qa-db-ja.com

EC2インスタンスの本番モニタリング

EC2で最初の本番インスタンスをセットアップしていて、必要なすべてのモニタリングが適切に行われていることを確認したいと思います。監視したいものには3つの異なるタイプがあります。

  1. インスタンスは実行されていますか? EC2インスタンスは、基盤となるハードウェアに障害が発生した場合、警告なしに終了できます。私が知る限り、EC2インスタンスは自動的に再起動されません。したがって、そうでない場合は、バックアップを開始します。

  2. UNIXは正しく実行されていますか?これは、CPU負荷、ディスク容量などに関する通常のことです。

  3. ウェブサイトは応答していますか?そうでない場合は、再起動します。

最初はクラウド外の物理サーバーにNagiosをセットアップしましたが、実際には項目2でのみ役立ちます。インスタンスがなくなったか、Webサイトが応答していないかはわかりますが、私が知る限りでは」 t状況を修正するためにコマンドを実行します。

このテーマに関する私のグーグルは、サボテン、モニット、神、神経節、そしておそらく私が今忘れているより多くの選択肢を生み出しました。それらすべてを研究する時間がありません。私はAmazonのCloudwatchを知っていますが、私のNagiosインストールがまだ行っていないことは何もしていないようです。

すでにこのようなものを用意している場合は、うまくいったことを教えてください。

3
Janine Ohmer

Monitは、必要なことのほとんどを実行する必要があります。もう少し高度で、より具体的にEC2に合わせたものが必要な場合は、 RightScale または Scalr (RightScaleのオープンソースの競合製品)が提供するサービスをご覧ください。

2
gareth_bowles

Puppetを使用してこの問題を解決しました... puppetクライアントがインストールされた独自のAMIと、puppetプロセスを開始して有効にする前にホスト名を設定するユーザーデータSysV-initスクリプトを作成しました。

EC2インスタンスがpuppetmasterに接続すると、現在のIPアドレスが渡されます。これを使用して、EC2ノードのNagios構成をテンプレート化できます。 IPアドレスが変更されると、Nagios構成ファイルが更新され、PuppetがNagiosの再起動を開始します。

EC2インスタンスを再起動するには、EC2 APIツールをモニタリングボックスにインストールし、インスタンスの起動プロセスを自動化するための何かを設定する必要があります。これを実行し、開始を要求されているホストごとにユーザーデータの内容を設定するRubyスクリプトを作成しました。

2
Jeremy Bouse

免責事項、私はゼノスコミュニティマネージャーです。

Zenossはあなたが求めていることを正確に行います。

1)EC2インスタンスを監視するためのZenoss ZenPackがあります: http://community.zenoss.org/docs/DOC-442

2)SSHをオンにして、OSレベルでインスタンスを監視することにより、インスタンスを監視することもできます。この方法で、EC2でDebian、Ubuntu、CentOS、OpenSolarisを実行しました。

3)プロセス、ページの確認、または合成クリックスルーによってWebサイトを監視できます。 Zenossのイベントに応答して、「/ etc/init.d/Apache restart」などのイベントコマンドを呼び出して、ダウンしたWebサーバー(またはスクリプト化できるその他のもの)を再起動できます。

http://zenoss.org でチェックしてください

0
mray

これを追加したいと思います。ウェブサイトの稼働時間を監視するという点で、私の会社はPingdomを使用しており、正直に言って彼らに興奮しています。

http://www.pingdom.com/

彼らはあなたのサイトがダウンしたときにあなたに通知するAndroidとiPhoneアプリ(本当にうまくいく)さえ持っています。

そして、完全な開示のために、いいえ、私は彼らや何かのために働いていません。私はただ熱狂的な顧客です:)

0