「私の」DL165G7 Proliantsの1つが、今月2度目の再起動を行いました。再起動には、LightsOutの次のシステムイベントログエントリが伴いました。
Event Type Date Time Source Description Direction
OEM -- -- -- 00 00 00 00 01 02 00 00 00 00 00 00 00 --
Generic 07/19/2013 16:40:38 NMI Detect State Asserted Assertion
Generic 07/19/2013 16:40:42 Gen ID 0x41 Run-time Stop Assertion
OEM 07/19/2013 16:40:42 000137 01 80 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 02 54 44 4f 00 01 --
OEM 07/19/2013 16:40:42 000137 02 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 03 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 03 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 04 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 04 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 05 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 05 00 00 00 00 01 --
Generic 07/19/2013 16:43:54 Gen ID 0x41 C: boot completed Assertion
OEM 07/19/2013 16:43:54 000137 00 b4 6c e9 51 00 --
イベントのデコードについてHPサポートに連絡しましたが、残念ながら目立った成功はありませんでした。アクセス可能なドキュメントがないと言われました。それは私に何を伝えようとしているのですか、そしてここで何が壊れているのかをどうやって見つけるのですか?
編集:システムはHyper-V2012を実行しています。リセットに関する唯一の有用なイベントはKernel-Power/41で、BugcheckCodeは128/0x00000080、BugcheckParameter1は0x4f4454で、iLOイベントログの最初の2つのOEM行と一致します(少なくとも、リトルエンディアンの方法でバイトを交換します)。バグチェックコードは私を このMSDNの記事 に導きました。これは「正確な原因を特定するのは難しい」と率直に述べています。
HPサポートセンターで、 一見同様の問題の説明 を見つけることができました。解決策は、クラスターノード間でクロックを同期することです。私の壊れたホストは確かにクラスターで実行されますが、クロックが同期されており、クロックが離れているときに問題を再現できません(明らかなKerberos認証の問題は別として、クロックを非同期にしても何も起こりません)。
これまでにこの問題に関して収集できた奇妙な情報:
HP ProLiant G380G6とWindows2008 R2でも同様の問題が発生し、サポートフォーラムとヘルプフォーラムを掘り下げてもどこにも行き着きませんでした。最終的には、HP Smart Update Manager DVDを使用して、サーバーにすべての最新の更新プログラムを1年半インストールしました。これまでのところエラーなしで合格しました。
ロングショットかもしれませんが、最新のアップデートを使用してみてください これが最新のHP SUM DVDです
それを2012サーバーで実行しようとすると、互換性がないというエラーが発生する可能性があります HPによると、これは正常です エラーを無視するだけで済みます。
お役に立てれば。