web-dev-qa-db-ja.com

頻繁なRAID警告メッセージ(予期しない意味-コマンドが中止されました)を心配する必要がありますか?

2台の仮想サーバー(1台のWindows Server 2008R2と1台のWindowsServer 2012)でWindows Server 2008 R2とHyper-V(バージョン6.1)を実行しているFujitsu Host(PRIMERGY RX300 S6)があります。 25人の従業員は、平日は継続的に仮想サーバーに接続し、共有フォルダーに対してファイルの読み取りと書き込みを行います。

ホスト上のストレージコントローラーは、LSICorpによるRAIDCtrl SAS 6G 5/6 512MB(D2616))です。

最近、レイドマネージャーが非常に頻繁に警告メッセージを表示することを発見しました。ほぼ毎分1回、場合によっては1分あたり最大15または20回。

各警告メッセージは次のようになります。

-------
Event: Warning
Date: Mar 18, 2015, 1:04:49 PM
Source: Toshiba MBF2600RC (1:0)
ID: 10909
Event: Adapter FTS RAID Ctrl SAS 6G 5/6 512MB (D2616) (0): Unexpected sense: 
     Disk (1:0), CDB:28 00 1B 02 B5 80 00 00 80 00, Sense:(command aborted)72 0B 4B 04 00 00 00 20 80 1E 00 28 52 08 01 00 50 03 00 57 00 F3 3F 40 50 06 05 B0 00 02 72 BF 00 01 0C 00 00 00 00 00 
------

残念ながら、この警告メッセージがいつ発生し始めたかを知ることができませんでした。

警告について少し心配している理由は、私には奇妙に見えることは別として、Backup Execが突然完了するのに通常より3〜4時間長くかかり始め、現在は約22〜23時間かかるためです。ジョブのプロパティを比較すると、この特定のサーバーのBackupExecのジョブ速度が約800MB /分から550MB /分に低下していることがわかります。

私のハードウェアプロバイダーから、メッセージは単なる情報であり、サーバーを交換する必要があるとの連絡がありました。 3.5歳で1年以内に交換する必要があると思いますが、それでもこの問題の根底に行きたいと思います。

3
Francis

エラーデコードはBh/4Bh/0Bh = ABORTED_COMMAND/NAK_RECEIVEDです。これらをデコードし、 http://scsi.ev-en.org/ で基本的な評価を行うための独自のツールを作成しました。

これらのエラーは、どこかに不良リンクがあることを示しています。ほとんどの場合、不良ケーブルですが、どちらかの側(ドライブまたはスロット)の不良ポートである可能性もあります。

2
Baruch Even

はい、心配する必要があります。 極端に関係はありませんが、調査し、必要に応じて一部の部品を交換してください。

SCSIエラーは通常によって生成されます:ドライバー/ファームウェアの問題またはハードウェアの障害。

参照: http://en.wikipedia.org/wiki/Key_Code_Qualifier

ただし、少なくとも、SCSIエラーは「問題が発生した」ことを意味します。これは小さな問題にすぎないかもしれませんが、頻繁に発生する小さな問題はかなり大きな問題であり、より深刻な問題が発生していることを意味します。

0
Sobrique