HP SmartArrayハードウェアRAIDコントローラーを搭載したサーバーがあります。そのステータスを監視するために、私はcpqarraydを使用します。 /etc/default/cpqarrayd
には、何かが発生したときにSNMPトラップを送信するためのDAEMON_OPTS="-t localhost:162"
が含まれています。トラップはsnmptrapdによって処理され、/etc/snmp/snmptrapd.conf
には
disableAuthorization yes
traphandle default mailx -s "SNMP Trap" [email protected]
この方法で受信した電子メールにはSNMPトラップが含まれていますが、人間が読める形式ではなく、その内容やcpqarraydによって発行されたものかどうかを判断することはできません。 RAIDステータスが変更されたときに、人間が読める形式の電子メールを送信することは可能ですか?
Cron.hourlyに配置された次のスクリプト:
#!/bin/sh
CCISS_DEVICE=/dev/cciss/c0d1
STATUS_FILE=/var/cciss_vol_status
TMP_FILE=$TMPDIR/status-$$.$RANDOM
mv $STATUS_FILE $TMP_FILE
cciss_vol_status $CCISS_DEVICE >$STATUS_FILE
if ! cmp -s $STATUS_FILE $TMP_FILE ; then
mailx -s "CCISS status changed" [email protected] <$STATUS_FILE
fi
rm $TMP_FILE
まず、以下を参照してください。 ドライブに障害が発生したときにHPサーバーから電子メールを送信するにはどうすればよいですか?
つまり、 ProLiantのサービスパック または 管理コンポーネントパック (Debian)の一部としてインストールされているHP SNMP管理エージェントは、システムの状態に関する適切なアラートを提供します。 。これには、ディスク、アレイコントローラー、ファン、温度、電源、ILO、NICなどのトラップが含まれます。
これはDebianで完全にサポートされています。ダウンロードは HP Software Delivery Repository にあります。
これに対する2つの部分(インストーラーによって自動的に構成されます):
あなたのsnmpd.conf
ファイル:
# Following entries were added by HP Insight Management Agents at
# Thu Mar 18 04:14:43 PDT 2010
dlmod cmaX /usr/lib64/libcmaX64.so
これにより、HPヘルスエージェントがSNMPに登録されます。
そしてその /opt/hp/hp-snmp-agents/cma.conf
ファイル:
############################################################
#
# cma.conf: HP Insight Management Agents configuration file
#
############################################################
########################################################################
# trapemail is used for configuring email command(s) which will be
# executed whenever a SNMP trap is generated.
# Multiple trapemail lines are allowed.
# Note: any command that reads standard input can be used. For example:
# trapemail /usr/bin/logger
# will log trap messages into system log (/var/log/messages).
########################################################################
trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm' [email protected]
一般的なRAIDアラートメールは次のようになります。
Trap-ID=3040
Accelerator Board Battery status change, slot number: 1.
Battery failed. Status: Failed..
または
Trap-ID=3034
Logical Drive Status Change: Slot 1, Drive: 2.Status is now Rebuilding.
または
Trap-ID=3034
Logical Drive Status Change: Slot 1, Drive: 1.Status is now OK.
編集:
100シリーズのProLiant、HP Healthエージェント、Debianで問題が発生しているようです。これはサポートされているソリューションですが、ソリューションのインストール方法と構成方法によっては、 問題が発生する可能性があります 。それを考えると、おそらく cciss_vol_status ユーティリティをインストールし、cronを介して定期的なチェックを実行することができます。
snmptt(SNMP Trap Translator) は、このための優れた小さなツールです。典型的なOIDとメッセージを教えて、それらをいくつかの賢明なメッセージに変換することができます。見て、それがあなたのニーズに適しているかどうかを確認してください。
編集:ああ、まだ持っていない場合は、移動して SNMP MIBをダウンロード デバイス用に入れてください/usr/share/snmp/mibs
ディレクトリ。次に、snmpdとsnmptrapdを再起動します。