web-dev-qa-db-ja.com

AMCC 3ware 9650seレイドカードの使用経験はありますか?私たちのものは死んでいるようです

メインディスクアレイ用に8ポートの3ware9650seRAIDカードがあります。保留中の停電のためにサーバーを停止する必要があり、マシンの電源を入れ直したとき、レイドカードは起動しませんでした。

このカードは数年間問題なく使用されており、シャットダウンするまで機能していました。

これで、マシンの電源を入れると、通常はブートローダーが表示されない前に起動するBIOSオプションROMが起動せず、どのドライブも起動せず、OSがデバイスにアクセスしようとするとタイムアウトします。

そのファームウェアは過去にアップグレードされているため、何らかのファームウェアのバグが発生した可能性があります。

OS用のgentooを搭載したSiliconMechanicsR272マシンで使用しています。 OSは最終的に起動しますが、残念ながら、カードはありません。

新しいものを注文しましたが、カードを交換すると既存のアレイが認識されないのではないかと心配しています。以前にカード交換を行った人はいますか?

どんな助けでも大歓迎です。

編集:これらは私たちが見るカーネルエラーです:

3ware 9000 Storage Controller device driver for Linux v2.26.02.012.
3w-9xxx 0000:09:00.0: PCI INT A -> GSI 18 (level, low) -> IRQ 18
3w-9xxx 0000:09:00.0: setting latency timer to 64
3w-9xxx: scsi0: ERROR: (0x06:0x000D): PCI Abort: clearing.
3w-9xxx: scsi0: ERROR: (0x06:0x001F): Microcontroller not ready during reset sequence.
3w-9xxx: scsi0: ERROR: (0x06:0x0036): Response queue (large) empty failed during reset sequence.
3w-9xxx 0000:09:00.0: PCI INT A disabled
2
antiduh

私たちはなんとか魔法のようにカードを生き返らせることができました。カードをマシンから取り出し、まったく新しいドライバーで何かredhatを実行しているまったく別のマシンに貼り付けました。ストーリーは、最初に起動したときに、(私たちが見ていたように)起動中にレイドBIOSが起動しなかったということですが、カーネルは多くの異なるエラーを報告しました。最終的には実際に起動することができ、次の再起動でレイドBIOSが再び機能し始め、正常に起動しました。私たちはそれを機械に戻し、すべてが生き返りました。

私には、これはマイクロコードの問題のように聞こえます-サウンドカード、ソフトレイド、ビデオカードなどのドライバをオンにすると、ある種のマイクロコードがカードにダウンロードされるのを見てきました。前回の事態が悪化した場合、または電源が切れたときにUPSからの電源ブリップが発生したために破損した場合(ホールの下の壁が滝に変わった場合)、それは確かに何が起こったのかを説明します。

私は将来のすべてのグーグルのためにアップデートを投稿すると考えました。

編集3- 2012年1月3日:@raksliceは、これらのカードにはバッテリーバックアップが取り付けられていることが多いことを指摘しました。私たちはバッテリーを取り除こうとはしていませんでしたが(考えもしませんでした)、それは素晴らしいアイデアです。この問題を抱えている他の人は、同じことを試してみたいと思うかもしれません。 Fedoraカーネルがカードを回復するために魔法のハンドシェイクを行ったために修正したのか、それとも何かがリセットされるのに十分な時間電源が入っていないままになっているのかはまだわかりません。

0
antiduh

3wareカードを交換するのは非常に簡単です。

同じモデルまたは新しいモデルであり、ファームウェアのバージョンが同じであることを確認してください。ファームウェアのバージョンが異なる場合、ディスクはコントローラーにインポートされません。 (そこにいる、それをした)

古いカードはlspciに表示されますか? BIOS設定がスクランブルされ、カードがまったく表示されないという問題が発生しました。 PCIスロットを再度有効にし、3WareカードのMSIを再度有効にする必要がありました。

3
James

これは以前に投稿したダンです、今回はアカウントを作成しました:)

とにかく、私のデータが引っ張られたので..私はカードと成功を台無しにすることに決めました!!

  1. Ubuntu 10.04.3LTSのLiveCDバージョンをダウンロード

  2. ライブで起動し、カードが検出されたことを確認しました( 'tail/var/log/messages | grep 3w-')

  3. 次の男のリポジトリからtw_cliをインストールしました: http://jonas.genannt.name

  4. 9500S-8用のCodeSet9.3.0.8から最新のファームウェア(2.08.00.009)を http://www.3ware.com/support/downloadpageprod.asp?pcode=9&path=Escalade9500SSeries&prodname=3ware%209500S%)からダウンロードしました。 20シリーズ

  5. Tw_cliを使用してファームウェアをフラッシュしました(3wareのストックtw_cliはこれをサポートしていません)。フォースフラグを使用せず、同じバージョンを使用しているにもかかわらず点滅しました。

  6. それが私にそう言ったときに再起動しました。

BIOSが期待どおりに表示されるようになりました。

RMA my!@#。おそらくこれを3Wareと共有する必要があります。聞いてくれたみんなに感謝します。

2
Dan

最新の一般的なマザーボードで3ware9650レイドカードを使用する際の情報:

  • フルサイズの9650カードは新しいマザーボードでは機能しないため、避けてください。BIOSはソフトリセット後に起動できません。古いマザーボードでは正常に動作します(core2マザーボードでテスト済み)。

  • ロープロファイル9650SEカードは後で作成され、最新のuefiなどのマザーボードで正常に動作します。

  • 彼らはまだ働いています(それらのほとんどはおそらく2007年頃に作られましたか?)

  • 8〜9年後、まだ故障したバッテリーは見られませんでした(理想的な状態で使用し、バッテリーは常にチェックされ、充電されています)。

  • カードを切り替えることはできますが、同じファームウェア(または同じバージョンが利用できない場合は新しいファームウェア)を使用してください。レイドを構築するときは、最初に低いポートを使用します。これは、元のカードで高いポートが使用されていない限り、ポートの少ない9650カードに簡単に切り替えることができるためです。

  • マザーボードの最初のx16pci Expressポートを避けてください。一部のマザーボードはそこにビデオカードを期待しているため、奇妙な動作が発生します。

  • 3dm2をインストールすると、cliはubuntuですぐに機能します(テスト済み:14.04LTS、16.04LTS)。インストールからシェルスクリプトを実行するだけです。

  • 3wareがなくなったことは残念です、これらは素晴らしい製品です

  • それでも使用する場合は、悲しいことに、何か新しいことに気を配る時が来ました。考慮すべきLSI(現在のブロードバンド)しかないのではないかと思います。

  • broadcomがAvagoを購入した後、Avago Webサイトに変更を加えたため、3wareのドライバー/ダウンロードを見つけるのが困難になりました。

2
azazil

3wareカードはexcellentアレイの互換性があります。ファームウェアが古いカードよりも古くないことを確認してください(判断できる限り)。可能であれば、同じシリーズ内にとどめておくことをお勧めします。

これらの2つを覚えておいてください、そしてそれはうまくいきます。

1
LapTop006

私はたまたま9500S-8を搭載したマシンで何度か起動を繰り返しましたが、同じ運命をたどったようです。 3wareから9650の記事に出くわし、修正方法を説明しました。カードをRMAすることが唯一の選択肢である3Wareのソリューションを信じることができませんでした。

とにかく、私はBIOSを復活させるために前述の魔法のいずれかを適用することに成功していません。ありがたいことに、別のマシンで数回再起動した後、起動後に正しく検出され(BIOSはまだ起動していません)、RAIDアレイを検出し、マウントしてデータをプルすることができます。

UbuntuとFedoraの両方のディストリビューションに、BIOS文字列が見つからないという1つを除くすべてのカード情報が表示されます。ファームウェアのアップデートを台無しにする前にデータをプルしますが、それまでの間、これを読んでいる場合は、Redhatのバージョンやドライバー、または他の手順に関する追加情報がありますか? ?ファームウェアのアップデートでこれが解決するとは思いません。

1
DanBo

あなたは良いはずです、私はその特定のカードでそれをしていませんが、他の多くのハードウェアRAIDカードでそれをしました。私があなたに提案する唯一のことは、カードを別のマシンに投げ入れて、それが機能することを確認し、古いカードと同じ同じBIOSレベルである-必要に応じてダウングレードすることです。

1
Zypher

Iveは3ware9650seで優れた結果を出しました。私はそれらのいくつかを所有しました:いくつかの2ポートカード、4ポートカードのペア、そして私が大きな価格で使用した1つの12ポート。私は通常、ビデオカードに使用されるPCI-eスロットにそれらを接続しますが、それらは正常に機能します。

しかし、私はそれらをクラッシュさせるBIOS設定を見つけました。それはPCIレイテンシータイマーと呼ばれます。私は多くのAMDメインボードを使用していますが、このBIOSオプションがあるものはデフォルトで64になります。32に設定しない限り、安定したものはありません。

とにかく、1つのアレイを5 x 2TBドライブにアップグレードしようとしています。コントローラーを交換する必要があるので、あなたの答えは私に希望を与えてくれました。

アレイに関する情報はドライブに書き込まれていますか?それは、別のコントローラーがアレイをインポートする方法ですか? (私はそれがどのように行われたかを見る必要があります)

0
compdoc

私は3Ware9650SEカードの安定版を持っており、交換は簡単です。私は4枚と8枚のポートカードを持っているので、展開する前にそれをテストしました。しかし、最近、3wareでの私の経験はひどく酸っぱいものになりました。それは、5 x1.5TBドライブを備えたバックアップボックスのハングから始まりました。負荷が高い場合(大きなtgzファイルを解凍するだけ)、コントローラーは不安定であり、バーンインテストから1日以内にクラッシュしました。予備のコントローラーは正常に機能しました。次に、2番目のコントローラーに障害が発生し、過去4回の交換品を返送しました。提供されたファームウェアまたは最新のファームウェアでのバーンインテストから48時間以内にすべて失敗します。 5〜7台のドライブのRAID 5アレイは、システムの電源を切らない限りカードが検出されないほどシステムをクラッシュさせることがあります。 4つのHDのRAID5アレイも失敗しますが、数時間ではなく数日かかります。承認されたマザーボードを使用していないため、QA担当者は私に話しかけませんが、テストに使用する3つの異なるマザーボード(すべてAsus、2 AMD、1 Intel)があり、故障したカードはすべてで失敗しますそれら。失敗は基本的に一連のパリティエラーです。通常、カードが応答せずリセットされているというメッセージが表示され、その後、操作中のデータが完全にハングして破損します。

今、私はカードを信用できません。数日間のバーンインテストだけで、カードが負荷の下で安定するかどうかがわかります。保証交換のためにそれらを送ることは、フレーク状のカードを別のフレーク状のカードと交換する方法のようです!

0
Eric

私は8ポートカードを12ポートカードに交換し(編集では9650ではなく9500であると考えて)、他のカードがアレイを検出したので、私の経験に基づいて動作することを期待できます。

0
James