web-dev-qa-db-ja.com

恐ろしい0x9CBSODのトラブルシューティング

Windows Server 2003 R2、Service Pack2がインストールされたEnterprisex64を実行しているDellPowerEdge2950があります。

最近、そのサーバーで複数のSTOPエラーが発生しています。幸い、フェイルオーバーマシンとして配置されているため、現在、本番環境に影響を与えていません。サーバーログに表示されるエラーは次のとおりです。

Event Type: Error
Event Source:   System Error
Event Category: (102)
Event ID:   1003
Description:
Error code 000000000000009c, parameter1 0000000000000004, 
parameter2 fffffadf90881240, parameter3 00000000f2000000, 
parameter4 0000000000060151.

これまでのところ、私が追跡できた最善の方法は、9Cエラーがある種の一般的なハードウェアの問題であるということです。他のパラメータは、これを絞り込むのに役に立たなかった。

マシンが昨年稼働して以来、ハードウェアの変更はありません。動作が発生していない同一のツインボックス(これがフェイルオーバーとして機能するプライマリ)があります。最後のソフトウェア変更は、いくつかのセキュリティ更新プログラムが適用された2009年4月16日でした。ブルースクリーンは2009年5月9日に発生し始めました。

この問題に役立つ可能性のある診断はありますか?

3
palehorse

http://www.d-a-l.com/archive/index.php/t-49205.html でKazna3の回答を参照してください。彼/彼女は次のように書いています。

しかし、最初に、BSODはかなり古いです。 0x9C BUGCHECKはハードウェア関連であり、よく知られています。それの残りはプロセッサに関係します、それはプロセッサ障害または単にプロセッサドライバです。 :(

説明については、こちらをご覧ください:0x9C:MACHINE_CHECK_EXCEPTION( http://msdn2.Microsoft.com/en-us/library/ms795775.aspx

Microsoftは、P4で入手したときに、これをアドバイスしていました。

ステップ1)BIOSを更新します(マイクロコード更新と呼ばれるハードウェアパッチがここにあります。プロセッサまたはAMLIにエラッタがある場合は、ここで修正されます)。

ステップ2)これは厳密なハードウェアエラーであるため、すぐにハードウェアベンダーに連絡してください。

ステップ3)CPUから始めて、ハードウェアを交換します。

言い換えれば、ハードウェアが壊れている可能性があります。おそらく電圧低下、または高熱。コンポーネントがソリッドステートであるからといって、失敗できないわけではありません。例:RAMは常に失敗します-静電気に強いバッグで出荷されるのには理由があります。

2
username

Microsoft KB 939315を参照してください-storportドライバーがこれを引き起こす可能性があります.....再起動またはシャットダウン時、または単に実行中にエラーが発生しましたか?

0
Tom

マシンに物理的にアクセスできますか?ステータスLCDは、これが発生したときにエラーコードを表示しますか、それとも気付かないように見えますか?

OpenManageがインストールされている場合は、すでに準備が整っています。 OpenManageログをチェックして、ハードウェアエラーがログに記録されているかどうかを確認します。 OpenManageには、かなりフル機能の診断スイートも含まれています。使用方法の説明については、 http://www.Dell.com/downloads/global/power/ps1q06-20050259-Thathireddy.pdf を確認してください。デルのサポートでは通常、いくつかのCLI診断テストを実行する必要があるため、それらに連絡するのが最善の場合があります。

一般的な手順として(そしてサポートがこれを行うように要求するのを防ぐために)、 BIOSと組み込みサーバー管理BMCファームウェアを更新します

スペアがある場合はCPUを交換してください。

また、奇妙に聞こえるかもしれませんが、DRACがインストールされている場合は、それを削除してください。 CPUエラーコード(E07F0)が表示され、ランダムにフリーズし、ときどき起動に失敗する2850がありました。 DRACを交換すると修正され、それ以来問題は発生していません。

これがうまくいかない場合は、デルに電話してください。これはOSレイヤーより100%下です。

0
sh-beta