EC2インスタンス(Windows Server 2008)は、過去3か月間に複数回クラッシュしました(前回は本日1:05 ESTでした)。 MEMORY.DMPファイルを確認したところ、クラッシュの考えられる原因はrhelnet.sys(RedHat PV NIC Driver))であることがわかりました。
サーバーのイベントビューアには、クラッシュ直後に次のレコードがあります。
Critical - Kernel Power:
The system has rebooted without cleanly shutting down first.
This error could be caused if the system stopped responding, crashed, or lost power unexpectedly.
BugCheck:
The computer has rebooted from a bugcheck. The bugcheck was:
0x000000d1 (0x000000000000002d, 0x0000000000000002, 0x0000000000000000, 0xfffff88001402d14).
A dump was saved in: C:\Windows\MEMORY.DMP. Report Id: 100113-35849-01.
これはハードウェアの問題でしょうか?インスタンスを停止して開始すると役に立ちますか?または、これはシステムで実行されているソフトウェアが原因である可能性が高いですか?
[更新10.01.2013]
Amazon担当者は、インスタンスでRHドライバーをCitrixPVドライバーに更新することを提案しました。
[2013年8月10日更新]
複製されたインスタンスでドライバーのアップグレードを実行しました。アップグレードの直後に、イベントビューアに次のエラーが表示されました。
Xennet6 errors in Event Viewer (Event ID# 5001)
もう少し掘り下げた後、私は this 最新のCitrixドライバーのインストールを提案する記事を見つけました。残念ながら、これはまったく役に立ちませんでした。また、複製されたインスタンスが応答しなくなりました。
[2013年8月10日更新2]
インスタンスを再作成し、PVドライバーを再度更新しました。インターネットで検索した後、私は見つけました this AmazonRepがそれを説明している記事:
"Event ID 5001 from source Xennet6 cannot be found" message does not
indicate anything wrong, just that the PV driver is looking for a feature
that we have not implemented in our version of Xen.
テストシステムをしばらく実行し続けて、問題がないかどうかを確認します。
Amazon Repの提案に従ってドライバーをアップグレードすると、問題が修正されました。
以下のEvent ID 5001...
の問題に関して、Amazonから受け取った返信は次のとおりです。
Please ignore the Xennet 5001 error. This error occurs on every instance
that is launched with Citrix PV drivers and is due to the driver looking
for a feature that is not supported on EC2. It will have no other effect on the instance.
同じ問題が発生しました。
しかし、AWSサポーターは以下のように私に答えます。CitrixPVドライブからの問題は確かではありません。
Currently, we are unable to root cause the issue.
In my personal opinion, this might be a one-time only occurrence,
but as you are running Citrix PV Drivers, I highly encourage you to upgrade.
As the Citrix drivers show up in the logs,
they might had been related to the issue.