ハードドライブのスマートステータスを監視しようとしています。 smartctlツールとHP独自のhpacucliを試してADUレポートを生成しました。ただし、どちらも役に立ちません。 smartctlは、電源オン時間やハードドライブ温度などの値を表示しません。 ADUレポートはそれらが空であることを示しています。
HPレイドコントローラーでハードドライブを監視する正しい方法は何ですか?
Smartctl: smartctl -a -d cciss、0/dev/sg0
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-2.6.32-20-pve] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
User Capacity: 3,000,592,982,016 bytes [3.00 TB]
Logical block size: 512 bytes
Logical Unit id: 0x5000c5003f11a168
Serial number: XXXXXXX
Device type: disk
Local Time is: Sun Jul 14 22:42:08 2013 HADT
Device supports SMART and is Enabled
Temperature Warning Disabled or Not Supported
SMART Health Status: OK
Current Drive Temperature: <not available>
Read defect list: asked for grown list but didn't get it
Error Counter logging not supported
Device does not support Self Test logging
Hpacucli: hpacucli ctrl all diag file =/usr/monitor/report.Zip ris = on xml = on Zip = on
Smart Array P410 in slot 1 : Internal Drive Cage at Port 1I : Box 1 : Drive Cage on Port 1I : Physical Drive (3 TB SATA) 1I:1:12 : Monitor and Performance Statistics (Since Reset)
Serial Number XXXXXXXX
Firmware Revision 0003
Product Revision ATA ST33000650NS
Reference Time 0x00001715
Sectors Read 0x00000000f868ca8b
Read Errors Hard 0x00000000
Read Errors Retry Recovered 0x00000000
Read Errors ECC Corrected 0x0000000000000000
Sectors Written 0x0000000016dd925d
Write Errors Hard 0x00000000
Write Errors Retry Recovered 0x00000000
Seek Count 0x0000000000000000
Seek Errors 0x0000000000000000
Spin Cycles 0x00000000
Spin Up Time 0x0000
Performance Test 1 0x0000
Performance Test 2 0x0000
Performance Test 3 0x0000
Performance Test 4 0x0000
Reallocation Sectors 0xffffffff
Reallocated Sectors 0x00000000
DRQ Time Outs 0x0000
Other Time Outs 0x0000
Drive Rebuild Count 0 (0x0000)
Spin Retries 65535 (0xffff)
Recovers Failed Read 0x0000
Recovers Failed Write 0x0000
Format Errors 0x0000
Self Test Failures 0x0000
Not Ready Failures 0x00000000
Remap Abort Failures 0x00000000
IRQ Deglitch Count 0 (0x00000000)
Bus Faults 0x00000003
Hot Plug Count 0 (0x00000000)
Track Rewrite Errors 0xffff
Write Errors After Remap 0x0000
Background Firmware Revision 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
Media Failures 0x0000
Hardware Errors 0x0000
Aborted Command Failures 0x0000
Spin Up Failures 0x0000
Bad Target Count 0 (0x0000)
Predictive Failure Errors 0x00000000
これらのコントローラーでsmartctl
などを直接使用することは想定されていません。 HP Smart Arrayコントローラーは、さまざまな手法を使用して、ドライブとシステムの状態を判断します。 S.M.A.R.T。 はそれらの1つですが、最終的な決定ではありません。利用可能な専用ツールを利用することは理にかなっています。
したがって、あなたの場合、問題が発生したときに電子メールを送信するようにhp-snmp-agentsを構成します。 Linuxでは、電子メールはデフォルトでrootユーザーとsyslogのメッセージになりますが、アラートの宛先の構成は/opt/hp/hp-snmp-agents/cma.conf
で処理できます。
hpacucli
ユーティリティに関しては、hpacucli ctrl all show config detail
を実行すると、関連するアレイの正常性情報のほとんどが提供されます。
私にとってはこのように働いています
smartctl -d cciss,0 -a /dev/cciss/c0d0
Device supports SMART and is Enabled
Temperature Warning Enabled
SMART Health Status: OK
Current Drive Temperature: 31 C
Drive Trip Temperature: 68 C
Elements in grown defect list: 0
Vendor (Seagate) cache information
Blocks sent to initiator = 3203138637
Blocks received from initiator = 3715997197
Blocks read from cache and sent to initiator = 484569203
Number of read and write commands whose size <= segment size = 1111593814
Number of read and write commands whose size > segment size = 0
Vendor (Seagate/Hitachi) factory information
number of hours powered up = 14706.28
number of minutes until next internal SMART test = 33