冗長電源を備えたDellR610を購入しています。電源の1つに障害が発生した場合に警告するための最良の方法は何ですか? Windows Server 2008R2を実行します。この機械はコロケーション施設にあるので、警報は聞こえません。
Dell OpenManageは、PSUの問題を検出すると、イベントログにイベントを生成します。イベントログ内の特定のイベントを検出できる通知には、任意のソフトウェアを使用できます。アラートアクションを構成して、選択したプログラムを実行することもできます。これは、メール送信者などである可能性があります。
通知はDellOpenManageのITAssistantコンポーネントに組み込まれていると思いますが、これはマルチコンポーネントスイートであり、通知にMicrosoftのSystem Center Operations Managerを使用しているため、ベースライン部分にあるかどうかはわかりません。コロ施設内の単一サーバー。 ITアシスタントは、別のシステムIIRCで実行する必要があります。コロ施設によっては、アラートを受信するためにフックできるITアシスタントが設定されている場合があります。
ipmitoolは電源装置をプローブできます。私は主にLinuxマシンでこれを行いますが、ipmitoolはWindowsにも存在します。
# ipmitool sdr type "Power Supply"
Status | 64h | ok | 10.1 | Presence detected
Status | 65h | ok | 10.2 | Presence detected
PS Redundancy | 74h | ok | 7.1 | Fully Redundant
スクリプトを作成して出力を解析し、その出力を中央監視ホストに送信する(または電子メールで送信する)だけです。
R610自体から独立した監視ソリューションを探している場合は、 ITWatchDogs 'WeatherGoose-IIといくつかのCT-30-60-120変流器などの製品を使用できます。 、サーバーの背面にある2つのAC電源接続ごとに1つの変圧器。次に、いずれかの電源装置に障害が発生した場合、消費電流はゼロ(またはそれに近い値)に低下し、WeatherGoose-IIを設定して、発生時に電子メールまたはSNMPトラップを送信できます。
ただし、電気技師に電源コードを開いて、電流が流れる「ホット」ワイヤを電源コード内のトリオから分離して、変圧器の中心を単独で通過できるようにする必要があります。 CTを電源コード全体に固定するだけで、熱線と中性線の反対の電流が互いの磁場を打ち消し、CTは常にゼロ電流を「認識」します。
もう1つの可能性は、RCU-H(IT Watchdogsの親会社の別の支店によって製造されていますが、引き続きそれらを通じて利用できるはずです)です。これは、基本的に、それぞれを個別に監視および制御できる「スマート」ラックマウント電源タップです。出口。デルのサーバーからの両方の電源コードをRCU-Hの2つのソケットに差し込むだけで、それぞれの電流引き込みを監視し、どちらかの電源装置が突然電流の引き込みを停止した場合に警告を発することができます。
Nagios をご覧ください。
電源だけを監視したいのなら、それはやり過ぎでしょう。
ただし、これを設定すると、OpenManageにクエリを実行するNagiosプラグインがあるため、レイドの失敗、メモリの問題、シャーシファンなど、OpenManageによって生成されたアラートを監視できます。
さらに、過剰なRAM使用量、ハードディスクの空き容量、CPU%など)を監視できます。
HTTP、SMTP、FTPなど、そのボックスで提供しているサービスを監視することもできます。
セットアップは、別のボックスを使用して行うのが最適です。監視している機器のオフサイトにある場合は、停止中にアラートを受け取ることができます。それは多くの電力を必要とせず、あなたのオフィスや家に座っている古い箱である可能性があります。
電子メール、携帯電話、Firefoxプラグインなどへのアラートを設定できます。エスカレーショングループを構成して、最初に電子メールに送信し、アドレス指定されていない場合はテキストガイ#1、まだアドレス指定されていないテキストガイ#2などを送信できます。
基本的に、Nagiosでできることはかなり深く、システム管理者にとって素晴らしいツールです。