Dellサーバーを実行していますCentOS 6
を使用してPERC H710
RAID 5セットアップのRAIDコントローラカードで、RAIDコントローラの背後にあるハードディスクの障害/動作ステータスを監視したい。
次に、bashスクリプトを使用してハードディスクのステータスを監視し、問題が発生した場合にアラートメールを送信できるようにする必要があります。
LSI MegaRAID SAS
コマンドツール (LSI MegaRAIDについてSAS Linuxツール) CentOS/Red Hat/LinuxはPERC H710をサポートせず、smartctl
はサポートしませんそれも。
デルのWebサイトに基づいて、CentOS
ISこのサーバーではサポートされていません(NX3200 PowerVault
)そして、ハードディスクを監視するLinuxプログラムをダウンロードできませんでした。
[root@server ~]# lspci | grep RAID
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05)
[root@server ~]# smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net
Vendor: Dell
Product: PERC H710
Revision: 3.13
User Capacity: 299,439,751,168 bytes [299 GB]
Logical block size: 512 bytes
Logical Unit id: ....
Serial number: ....
Device type: disk
Local Time is: Tue Apr 15 16:38:30 2014 SGT
Device does not support SMART
Error Counter logging not supported
Device does not support Self Test logging
CentOS 6搭載のDell PERC H710でハードウェアRAIDの背後にあるハードディスクのステータスを監視する方法を知っている人はいますか?
S.M.A.R.T。 はではありませんディスクまたはストレージモニタリングの最後の単語です!!これはコンポーネントですが、最新のRAIDコントローラーは他の方法と一緒に使用して、ドライブとアレイの正常性を判別します。
これは、Dell PowerEdgeサーバーのPERCコントローラであると想定しています。
デルのハードウェアのヘルスモニタリングに対する通常のLinux対応のアプローチは、Yum- http://linux.Dell.com/wiki/index .php/Repository/OMSA#Yum_setup
yum install srvadmin-all
は、エージェントの完全なスイートをインストールします。インストールしたら、omreport
コマンドを使用して、アレイについて 情報を取得 できます。
例:
$ omreport storage vdisk
$ omreport storage pdisk controller=0
$ omreport storage vdisk controller=0 vdisk=1
SMART smartctlコマンドでディスクのステータスを確認できます。-d
引数。たとえば、アレイの最初のディスクを表示するには:
# smartctl -a /dev/sda -d sat+megaraid,00
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF INFORMATION SECTION ===
Device Model: ST91000640NS
Serial Number: ........
LU WWN Device Id: . ...... .........
Firmware Version: AA08
User Capacity: 1,000,204,886,016 bytes [1.00 TB]
Sector Size: 512 bytes logical/physical
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4
Local Time is: Thu Jul 10 11:21:52 2014 WEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
...
...
#
これは、smartmontools-5.43-1.el6.x86_64を備えたScientific Linux 6(別のRHEL6ベースのOS)にあります。
受け入れられた答えは、大胆さを推奨していますyum install srvadmin-all
。ブレッチ。これを少し弱くする方法ですが、それでもまだ弱く、HPのプラットフォームではより無駄を省くことができます。ただし、余談です...)つまり、マシンのストレージの管理に必要なコンポーネントのみをインストールします。
ところで、ユーザーの質問に対する直接の答えは、以下のリストの「vdisk 0上の物理ディスクを表示する」という項目にあります。
wget -q -O - http://linux.Dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi
bash bootstrap.cgi
yum install srvadmin-base
yum install srvadmin-storageservices
ルートの.bashrcに追加します。
export PATH=$PATH:/opt/Dell/srvadmin/bin
楽しい:
コントローラ0のすべての物理ディスクを表示する
$ omreport storage pdisk controller=0
コントローラ0のすべての論理ディスクを表示する
$ omreport storage vdisk controller=0
Vdisk 0上のすべての物理ディスクを表示する
$ omreport storage pdisk controller=0 vdisk=0
Raid0からraid1になるようにvdiskを再構成します(COOL !!!!)
$ Sudo omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3
新しいディスクに仮想ディスクを作成します。
$ Sudo omconfig storage controller controller=0 action=clearforeignconfig
$ Sudo omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2
ところで、これはIS DellブランドのLSI MegaCLIカードに過ぎないので、Han Soloの答えがもっと良いかもしれません!しかし、私はまだ試していません。
以下は、おいしいデータのバンドルのためにgrepを介してパイプされたomreportの出力の例です。
$ omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not "
List of Physical Disks belonging to root
Controller PERC H700 Integrated (Embedded)
ID : 0:0:0
Status : Ok
Name : Physical Disk 0:0:0
State : Online
Power Status : Spun Up
Bus Protocol : SAS
Media : HDD
Failure Predicted : No
Revision : HT64
T10 PI Capable : No
Certified : Yes
Encryption Capable : No
Capacity : 136.13 GB (146163105792 bytes)
Used RAID Disk Space : 136.13 GB (146163105792 bytes)
Available RAID Disk Space : 0.00 GB (0 bytes)
Hot Spare : No
Vendor ID : Dell(tm)
Product ID : ST9146852SS
Serial No. : 6TB1AFDT
Part Number : CN0X162K7262213800JTA01
Negotiated Speed : 6.00 Gbps
Capable Speed : 6.00 Gbps
Sector Size : 512B
Manufacture Day : 05
Manufacture Week : 10
Manufacture Year : 2011
SAS Address : 5000C500395E44C5
ID : 0:0:1
Status : Ok
Name : Physical Disk 0:0:1
State : Online
Power Status : Spun Up
Bus Protocol : SAS
Media : HDD
Failure Predicted : No
Revision : HT64
T10 PI Capable : No
Certified : Yes
Encryption Capable : No
Capacity : 136.13 GB (146163105792 bytes)
Used RAID Disk Space : 136.13 GB (146163105792 bytes)
Available RAID Disk Space : 0.00 GB (0 bytes)
Hot Spare : No
Vendor ID : Dell(tm)
Product ID : ST9146852SS
Serial No. : 6TB1AFEY
Part Number : CN0X162K7262213800FPA01
Negotiated Speed : 6.00 Gbps
Capable Speed : 6.00 Gbps
Sector Size : 512B
Manufacture Day : 05
Manufacture Week : 10
Manufacture Year : 2011
SAS Address : 5000C500395E3C1D
CentOSで動作させるのにも苦労していましたが、ここで動作するパッケージを見つけました http://mirror.ndchost.com/software/lsi/
「MegaCli-8.07.10-1.noarch.rpm」と呼ばれます
コマンドリファレンス http://hwraid.le-vert.net/wiki/LSIMegaRAIDSAS
お役に立てば幸いです。
smartctl -d megaraid,00 -a /dev/sda
Got MegaRAID inquiry.. FUJITSU MBE2147RC D906
Device: FUJITSU MBE2147RC Version: D906
Serial number: xxxx
Device type: disk
Transport protocol: SAS
Local Time is:
perccli
コマンドを使用すると、適切に尋ねれば、多くのドライブ情報も表示できます。
# /opt/MegaRAID/perccli/perccli64 /c0/e32/s0 show all
Controller = 0
Status = Success
Description = Show Drive Information Succeeded.
Drive /c0/e32/s0 :
================
-------------------------------------------------------------------------
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp
-------------------------------------------------------------------------
32:0 0 UGood - 278.875 GB SAS HDD N N 512B ST3300657SS U
-------------------------------------------------------------------------
EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down/PowerSave|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded|Cpybck-CopyBack|CBShld-Copyback Shielded
Drive /c0/e32/s0 - Detailed Information :
=======================================
Drive /c0/e32/s0 State :
======================
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature = 40C (104.00 F)
Predictive Failure Count = 1
S.M.A.R.T alert flagged by drive = Yes
これは、エンクロージャースロットごとに繰り返す必要があります。少なくとも、単一のperccli
コマンドで一度にすべてを印刷する方法は見つかりませんでした。
また、他のより包括的なオプションと比較して、インストールも簡単です。
# curl -C - -O 'https://downloads.Dell.com/FOLDER04470715M/1/perccli_7.1-007.0127_linux.tar.gz'
# tar xzvf ../perccli_7.1-007.0127_linux.tar.gz
# cd Linux/
# yum localinstall perccli-007.0127.0000.0000-1.noarch.rpm
# cd /opt/MegaRAID/perccli/
perccli
is [〜#〜] not [〜#〜] Delll OMSAのような包括的な監視スイートですが、多くの人々は包括的なものを望んでおらず、まともなものが必要なようです、シンプルなツール。