web-dev-qa-db-ja.com

ハードウェアRAIDステータスに関する電子メール通知

HP SmartArrayハードウェアRAIDコントローラーを搭載したサーバーがあります。そのステータスを監視するために、私はcpqarraydを使用します。 /etc/default/cpqarraydには、何かが発生したときにSNMPトラップを送信するためのDAEMON_OPTS="-t localhost:162"が含まれています。トラップはsnmptrapdによって処理され、/etc/snmp/snmptrapd.confには

disableAuthorization yes
traphandle default mailx -s "SNMP Trap" [email protected]

この方法で受信した電子メールにはSNMPトラップが含まれていますが、人間が読める形式ではなく、その内容やcpqarraydによって発行されたものかどうかを判断することはできません。 RAIDステータスが変更されたときに、人間が読める形式の電子メールを送信することは可能ですか?

解決

Cron.hourlyに配置された次のスクリプト:

#!/bin/sh

CCISS_DEVICE=/dev/cciss/c0d1
STATUS_FILE=/var/cciss_vol_status
TMP_FILE=$TMPDIR/status-$$.$RANDOM

mv $STATUS_FILE $TMP_FILE
cciss_vol_status $CCISS_DEVICE >$STATUS_FILE

if ! cmp -s $STATUS_FILE $TMP_FILE ; then
    mailx -s "CCISS status changed" [email protected] <$STATUS_FILE
fi

rm $TMP_FILE
2
Michael Ivko

まず、以下を参照してください。 ドライブに障害が発生したときにHPサーバーから電子メールを送信するにはどうすればよいですか?

つまり、 ProLiantのサービスパック または 管理コンポーネントパック (Debian)の一部としてインストールされているHP SNMP管理エージェントは、システムの状態に関する適切なアラートを提供します。 。これには、ディスク、アレイコントローラー、ファン、温度、電源、ILO、NICなどのトラップが含まれます。

これはDebianで完全にサポートされています。ダウンロードは HP Software Delivery Repository にあります。

これに対する2つの部分(インストーラーによって自動的に構成されます):

あなたのsnmpd.confファイル:

# Following entries were added by HP Insight Management Agents at
#      Thu Mar 18 04:14:43 PDT 2010
dlmod cmaX /usr/lib64/libcmaX64.so

これにより、HPヘルスエージェントがSNMPに登録されます。

そしてその /opt/hp/hp-snmp-agents/cma.confファイル:

############################################################
#
# cma.conf: HP Insight Management Agents configuration file
#
############################################################

########################################################################
# trapemail is used for configuring email command(s) which will be
# executed whenever a SNMP trap is generated.
# Multiple trapemail lines are allowed.
# Note: any command that reads standard input can be used. For example:
#             trapemail /usr/bin/logger
#       will log trap messages into system log (/var/log/messages).
########################################################################
trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm' [email protected]

一般的なRAIDアラートメールは次のようになります。

Trap-ID=3040

Accelerator Board Battery status change, slot number: 1.
Battery failed. Status: Failed..

または

Trap-ID=3034

Logical Drive Status Change: Slot 1, Drive: 2.Status is now Rebuilding.

または

Trap-ID=3034

Logical Drive Status Change: Slot 1, Drive: 1.Status is now OK.

編集:

100シリーズのProLiant、HP Healthエージェント、Debianで問題が発生しているようです。これはサポートされているソリューションですが、ソリューションのインストール方法と構成方法によっては、 問題が発生する可能性があります 。それを考えると、おそらく cciss_vol_status ユーティリティをインストールし、cronを介して定期的なチェックを実行することができます。

1
ewwhite

snmptt(SNMP Trap Translator) は、このための優れた小さなツールです。典型的なOIDとメッセージを教えて、それらをいくつかの賢明なメッセージに変換することができます。見て、それがあなたのニーズに適しているかどうかを確認してください。

編集:ああ、まだ持っていない場合は、移動して SNMP MIBをダウンロード デバイス用に入れてください/usr/share/snmp/mibsディレクトリ。次に、snmpdとsnmptrapdを再起動します。

0