web-dev-qa-db-ja.com

HP P410 ADU(hpacucli)が空のレポートを生成する

ハードドライブのスマートステータスを監視しようとしています。 smartctlツールとHP独自のhpacucliを試してADUレポートを生成しました。ただし、どちらも役に立ちません。 smartctlは、電源オン時間やハードドライブ温度などの値を表示しません。 ADUレポートはそれらが空であることを示しています。

HPレイドコントローラーでハードドライブを監視する正しい方法は何ですか?

Smartctl: smartctl -a -d cciss、0/dev/sg0

    smartctl 5.41 2011-06-09 r3365 [x86_64-linux-2.6.32-20-pve] (local build)
    Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

    User Capacity:        3,000,592,982,016 bytes [3.00 TB]
    Logical block size:   512 bytes
    Logical Unit id:      0x5000c5003f11a168
    Serial number:        XXXXXXX
    Device type:          disk
    Local Time is:        Sun Jul 14 22:42:08 2013 HADT
    Device supports SMART and is Enabled
    Temperature Warning Disabled or Not Supported
    SMART Health Status: OK

    Current Drive Temperature:     <not available>
    Read defect list: asked for grown list but didn't get it

    Error Counter logging not supported
    Device does not support Self Test logging

Hpacucli: hpacucli ctrl all diag file =/usr/monitor/report.Zip ris = on xml = on Zip = on

    Smart Array P410 in slot 1 : Internal Drive Cage at Port 1I : Box 1 : Drive Cage on Port 1I : Physical Drive (3 TB SATA) 1I:1:12 : Monitor and Performance Statistics (Since Reset)

    Serial Number                        XXXXXXXX
    Firmware Revision                    0003    
    Product Revision                     ATA     ST33000650NS    
    Reference Time                       0x00001715
    Sectors Read                         0x00000000f868ca8b
    Read Errors Hard                     0x00000000
    Read Errors Retry Recovered          0x00000000
    Read Errors ECC Corrected            0x0000000000000000
    Sectors Written                      0x0000000016dd925d
    Write Errors Hard                    0x00000000
    Write Errors Retry Recovered         0x00000000
    Seek Count                           0x0000000000000000
    Seek Errors                          0x0000000000000000
    Spin Cycles                          0x00000000
    Spin Up Time                         0x0000
    Performance Test 1                   0x0000
    Performance Test 2                   0x0000
    Performance Test 3                   0x0000
    Performance Test 4                   0x0000
    Reallocation Sectors                 0xffffffff
    Reallocated Sectors                  0x00000000
    DRQ Time Outs                        0x0000
    Other Time Outs                      0x0000
    Drive Rebuild Count                  0 (0x0000)
    Spin Retries                         65535 (0xffff)
    Recovers Failed Read                 0x0000
    Recovers Failed Write                0x0000
    Format Errors                        0x0000
    Self Test Failures                   0x0000
    Not Ready Failures                   0x00000000
    Remap Abort Failures                 0x00000000
    IRQ Deglitch Count                   0 (0x00000000)
    Bus Faults                           0x00000003
    Hot Plug Count                       0 (0x00000000)
    Track Rewrite Errors                 0xffff
    Write Errors After Remap             0x0000
    Background Firmware Revision         0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
    Media Failures                       0x0000
    Hardware Errors                      0x0000
    Aborted Command Failures             0x0000
    Spin Up Failures                     0x0000
    Bad Target Count                     0 (0x0000)
    Predictive Failure Errors            0x00000000
3
ispirto

これらのコントローラーでsmartctlなどを直接使用することは想定されていません。 HP Smart Arrayコントローラーは、さまざまな手法を使用して、ドライブとシステムの状態を判断します。 S.M.A.R.T。 はそれらの1つですが、最終的な決定ではありません。利用可能な専用ツールを利用することは理にかなっています。

したがって、あなたの場合、問題が発生したときに電子メールを送信するようにhp-snmp-agentsを構成します。 Linuxでは、電子メールはデフォルトでrootユーザーとsyslogのメッセージになりますが、アラートの宛先の構成は/opt/hp/hp-snmp-agents/cma.confで処理できます。

hpacucliユーティリティに関しては、hpacucli ctrl all show config detailを実行すると、関連するアレイの正常性情報のほとんどが提供されます。

1
ewwhite

私にとってはこのように働いています

 smartctl -d cciss,0 -a /dev/cciss/c0d0


Device supports SMART and is Enabled
Temperature Warning Enabled
SMART Health Status: OK

Current Drive Temperature:     31 C
Drive Trip Temperature:        68 C
Elements in grown defect list: 0
Vendor (Seagate) cache information
  Blocks sent to initiator = 3203138637
  Blocks received from initiator = 3715997197
  Blocks read from cache and sent to initiator = 484569203
  Number of read and write commands whose size <= segment size = 1111593814
  Number of read and write commands whose size > segment size = 0
Vendor (Seagate/Hitachi) factory information
  number of hours powered up = 14706.28
  number of minutes until next internal SMART test = 33
0
Akh