web-dev-qa-db-ja.com

データをバックアップすると、Symantec Backup Exec12またはHowI Came to LoatheIronyを使用してサーバーがクラッシュします。

Windows Server2003を実行しているDellPowerEdge2850があります。これはクライアントの1つのプライマリファイルサーバーです。 Symantec Backup Exec12のコアメディアサーバーとして機能するWindowsServer2003を実行している別のサーバーがあります。

最近、Backup Exec 11dから12にアップグレードしました。Exchange2003からExchange2007にアップグレードしたばかりなので、このアップグレードが必要でした。アップグレード後、新しいバージョン12のBackupExecリモートエージェントを各サーバーにプッシュインストールする必要がありました。バックアップ(合計約6)。私のサーバーのうち5台は問題なく動作しており、毎晩忠実にバックアップを完了しています。ファイルサーバーが定期的にクラッシュします。

観察:

  • サーバーがクラッシュしても、ブルースクリーンではなく、完全にロックされます。マウスでさえ反応しません。サーバーを十分に長くロックしたままにすると、サーバーは最終的に再起動し、Windowsのスプラッシュ画面でハングします。
  • 問題の有用なイベントビューアの証拠はまったくありません。翌朝、サーバーを起動するためにサーバーをハードリセットする必要がある場合、ログは通常のログから原因不明のシャットダウンイベントに移行します。
  • サーバーが正常に起動しない場合の90%は、Windowsのスプラッシュ画面でハングします。ここに当てる光はありません。サーバーがハングした場合、私にできることは、サーバーをハードリセットして再試行することだけです。起動とchkdsk/rの操作が成功した後でも、マシンを再起動すると、90%の確率で正常にバックアップされなくなります。

裏話:

このサーバーは、約1か月前の夜間バックアップ中にクラッシュし始めました。問題のトラブルシューティングを行うために考えられるすべてのことを試みましたが、サーバーをオンラインに戻すために午前4時にオフィスに来続けることができなかったため、最終的にはあきらめなければなりませんでした。ある金曜日、私は幸運に恵まれ、サーバーは完全バックアップのために稼働し続けました。この機会に、セットアップした一時サーバーに完全バックアップを復元し、すべてのユーザーを一時サーバーに切り替えました。次に、病気のファイルサーバーをリロードしました。

すべてのユーザーを一時ファイルサーバーに約3週間保持しました。通常のファイルサーバーで使用していたのと同じBackupExec RemoteAgentとTrendMicro A/Vクライアントを一時サーバーにインストールしました。この間、一時サーバーのバックアップにはまったく問題はありませんでした。

リロードされたファイルサーバーを広範囲にテストしました。サーバーを失敗させるために、サーバーを1時間に1回、3週間再起動しました。それは決してしませんでした。リロードが私の問題の答えであると確信しました。すべてのデータを一時サーバーから通常のサーバーに戻しました。それが再びロックされ、きれいに起動するというおなじみの失敗を開始する前に、私はそれから毎晩3つのバックアップを取得しました。

今週末、バックアップジョブ全体を通してファイルサーバーを監視することにしました。ファイルサーバーとBackupExecを実行しているサーバーにRDPdします。ファイルサーバーでタスクマネージャーを開いて、プロセスを表示し、CPUとメモリの使用状況を監視できるようにしました。約60GB相当のバックアップですべてがスムーズに実行されていました。次に、BackupExecのバックアップジョブのバイト数が進行を停止していることに気付きました。 RDPセッションをファイルサーバーに振り返ると、CPUとメモリの使用状況に関するリアルタイムの更新がまだ取得されていました。どちらもほぼ0%で、これは珍しいことです。バックアップは通常、バックアップジョブの期間中約40%の使用率でホバリングします。

この点を繰り返します。画面が更新され、タスクマネージャーがリアルタイムで更新されていました-[スタート]メニューをクリックするまで。画面が真っ暗になり、サーバーがロックされました。実のところ、サーバーはすでにロックされていて、ビデオカードはまだそれを理解していなかったと思います。

私はトリックの袋に戻りました。オフィスに車で行き、サーバーがWindowsのスプラッシュ画面でハングアップしたときに、サーバーを何度もハードリセットしました。起動に成功せずに2時間これを実行しました。動作中の一時ファイルサーバーにすべてを戻すために使用する適切なバックアップがなかったため、パニックに陥り始めました。

やるべきことをすべて使い果たしたら、深呼吸をして、Windows Server 2003 CDを起動し、Windowsの修復インストールを実行しました。サーバーは正常に復旧し、すべてのデータはそのままでした。これでサーバーを自由に再起動でき、サーバーは正常に復旧します。問題は、そのデータを再度バックアップしようとするとすぐに、最初の1つに戻るのではないかと心配していることです。

要約すると、次のようになります。

これがこのサーバーのトラブルシューティングのためにこれまでに行ったことです:

  1. RAID5セットを削除して再作成しました。ドライブを初期化しました。 Server2003の新規インストールでサーバーをリロードしました。
  2. デルが承認した最新のBIOSおよびNICドライバ)をインストールしたことをデルに確認しました。
  3. Backup Exec RemoteAgentをアンインストール/再インストールしました。
  4. Trend Micro A/Vクライアントをアンインストールしました。
  5. サーバーを構成しましたnotブルースクリーンの後で自動的に再起動して、停止エラーを確認できるようにしました。以前はサーバーがブルースクリーニングだと思っていましたが、この設定を有効にしたので、サーバーが完全にロックされていることがわかりました。
  6. Windows回復コンソールからchkdsk/rを実行します。いくつかのエラーが見つかり、修正されましたが、問題は解決しませんでした。

次の仮定を確認または拒否するのに役立ちます:

  1. ここでは2つの問題が発生しています。そもそもサーバーがロックアップしている理由と、ロックアップ後にサーバーが正常に起動しない理由。
  2. これは最終的にはソフトウェアの問題です。サーバーは正常に動作し、OSの新規ロードまたは修復インストールの後、最初のロックアップまで、一日中きれいに再起動できます。
  3. これは、一般的にBackupExecでは問題になりません。他のすべてのサーバーは問題なくバックアップされます。ちなみに、他のすべてのサーバーはServer 2003を実行しており、一部のサーバーには、ここで問題となっているファイルサーバーよりも多くのデータが格納されています。

どんな助けでも大歓迎です。皮肉はほとんど耐えられない。私のデータをバックアップすることはそれを危険にさらしているものです。

4
Kyle Noland

2011年11月に投稿-これを試してください:

1)ファイルC:\ program files\symantec\SYNEVENT.SYSを右クリックし、[プロパティ]> [バージョン](タブ)を選択して、バージョン情報を入力します。

2)SymEventインストーラー/アップデーターをダウンロードします: ftp://ftp.symantec.com/public/english_us_canada/symevnt/Sevinst.exe

3)次の記事に従って、SymEventを更新します。 http://www.symantec.com/business/support/index?page=content&id=TECH98521

抜粋:
Windows 2003/XP/2000/NT(サーバーバージョンを含む)でSymeventファイルを更新するには:
A。 SymantecFTPサイトからSevinst.exeをダウンロードします。ファイルをハードドライブ上のフォルダに保存します。
B。コマンドプロンプトを開き、Sevinst.exeファイルをダウンロードしたフォルダーに移動します。
C。プログラムのバージョンに応じて、次のいずれかを実行します。

  • Symantec AntiVirus 9.x以降を実行しているコンピューターでは、次のコマンドを入力します。
    sevinst.exe/log SAVCE

  • Symantec AntiVirus 8.x以前を実行しているコンピュータでは、次のコマンドを入力します。
    sevinst.exe/log NAVNT


D。コンピューターを再起動します

2
Paulie D

Windowsのスプラッシュ画面でハングアップすると、RAIDコントローラーのファームウェアまたはドライバーがかなり疑わしくなります。それはDellPERCですか?現在、ファームウェアとドライバーを使用していますか?

正常にバックアップされている最後のいくつかのファイルとディレクトリについて何か特別なことはありますか(つまり、バックアップのその時点までのファイルに特徴のないもの)?

ファイルサーバー上のBackupExecリモートエージェントでデバッグログをオンにすることもできますが、ファイルシステムまたはディスクドライバーがフォールダウンしてクラッシュした場合、デバッグログは書き込まれない可能性があります。リモートエージェントサービスを停止し、サービスプロパティの[開始パラメータ]テキストボックスで指定された「-debug」パラメータを使用して開始します(「サービス」を使用している場合MMC snap -これを開始/停止します。「-debug」設定を永続的にする場合は、「HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\BackupExecAgentAccelerator」のImagePath値に追加します。

2
Evan Anderson

ドライバーの問題が疑われます。ちょうど同じような経験。レガシーアプリケーションはISDNモデムを使用します。新しいコンピューターに移動し、最新のモデムドライバーをダウンロードしました。

ISDN接続が切断され続け、モデム/回線だと思いました...しかし、結局のところ、最新のドライバを6(!)年前のものに交換し、それ以来問題なく動作しています。したがって、最新のドライバーが常に最良であるとは限りません。壊れていない場合は修正しないでください。

幸運を!

0
blank3

これはオープンファイルの問題である可能性があり、オープンファイルが破損している可能性があります。ウィンドウ(およびその下)ディレクトリを除くすべてをバックアップしてみてください。データだけをバックアップすると、吸盤がフリーズするかどうかを確認してください。また、ディスク容量がある場合は、NTバックアップを使用してディスク間バックアップを実行し、そのファイルをテープにバックアップします。現在のレスキューディスクを作成します。また、ADファイルを手動でバックアップします。

ハングせずにデータをバックアップする場合は、オープンシステムファイルの問題です。それでも問題が解決しない場合は、ExchangeまたはSQLサーバーを実行しない限り、ドライバーまたはハードウェアが疑われます。

0
Dan Sichel

テストについて言及しなかったことを思い浮かぶのは、RAMとシステム負荷レベルだけです。

RAMは簡単なはずですが、通常の使用ではトリガーされない不良領域の使用を引き起こすバックアップについて何かがあるかどうかはわかりません-それはちょうど収まりません。

もう1つは、ハードウェアの負荷レベルです。バックアップするときは、ディスクからNICを介して多くの情報を移動します。

  • RAIDコントローラーをチェックするという提案がすでに1つあります。バックアップの負荷をシミュレートするために大量の転送を実行して、チェックを追加します。また、バックアップの開始時または一定期間の持続的なスループットの後に停止しますか?

  • NICの負荷については、いくつか試してみます。別のNICを100MBitに強制し、大量のデータをプッシュします(ここでもバックアップの負荷をシミュレートします)。

それらをテストする際の最大の頭痛の種は、それらを個別にテストすることになる可能性があります。テストするのが最も簡単な項目としてNICから始めます。 RAIDコントローラーとは独立して1つ以上の追加ドライブをシステムに投入できる場合は、RAIDコントローラー自体が問題の原因であるかどうかを特定するための良い方法が得られる可能性があります。すべてを非RAIDドライブにコピーして、あなたはそれらをきれいにバックアップすることができます。

最初のロックアップの後に継続/繰り返しロックアップする場合-システムから電源を完全に削除すると問題は解決しますか?電源がオフになっているサーバーが完全にオフになっていないことを忘れないでください。特に、ネットワークインターフェイスはWake-on-LANのためにライブのままである可​​能性があります。ハードウェアの内部状態が正しくない場合、再起動しただけでは実際にはクリアされない場合があります。

0
fencepost

Backup Execでも同様の問題が発生しました(ただし、はるかに古いバージョン10)。最新の更新プログラムをインストールすると、スケジュールされたバックアップの直後または少し後にサーバーがBSODを開始しました。問題の正確な原因を特定したことはありませんが、それはすべてトレンドマイクロにも何らかの形で関係しているようであり、すべて一緒になってメモリ保護障害を引き起こしました。

私の解決策は、以前のBackup Execバージョンに戻し、TrendMicroを更新することでした(officescaneを使用している場合は、最近リリースされた新しいメジャーリリースがあります)。

0
Vitaliy