Windows Server2003を実行しているDellPowerEdge2850があります。これはクライアントの1つのプライマリファイルサーバーです。 Symantec Backup Exec12のコアメディアサーバーとして機能するWindowsServer2003を実行している別のサーバーがあります。
最近、Backup Exec 11dから12にアップグレードしました。Exchange2003からExchange2007にアップグレードしたばかりなので、このアップグレードが必要でした。アップグレード後、新しいバージョン12のBackupExecリモートエージェントを各サーバーにプッシュインストールする必要がありました。バックアップ(合計約6)。私のサーバーのうち5台は問題なく動作しており、毎晩忠実にバックアップを完了しています。ファイルサーバーが定期的にクラッシュします。
観察:
裏話:
このサーバーは、約1か月前の夜間バックアップ中にクラッシュし始めました。問題のトラブルシューティングを行うために考えられるすべてのことを試みましたが、サーバーをオンラインに戻すために午前4時にオフィスに来続けることができなかったため、最終的にはあきらめなければなりませんでした。ある金曜日、私は幸運に恵まれ、サーバーは完全バックアップのために稼働し続けました。この機会に、セットアップした一時サーバーに完全バックアップを復元し、すべてのユーザーを一時サーバーに切り替えました。次に、病気のファイルサーバーをリロードしました。
すべてのユーザーを一時ファイルサーバーに約3週間保持しました。通常のファイルサーバーで使用していたのと同じBackupExec RemoteAgentとTrendMicro A/Vクライアントを一時サーバーにインストールしました。この間、一時サーバーのバックアップにはまったく問題はありませんでした。
リロードされたファイルサーバーを広範囲にテストしました。サーバーを失敗させるために、サーバーを1時間に1回、3週間再起動しました。それは決してしませんでした。リロードが私の問題の答えであると確信しました。すべてのデータを一時サーバーから通常のサーバーに戻しました。それが再びロックされ、きれいに起動するというおなじみの失敗を開始する前に、私はそれから毎晩3つのバックアップを取得しました。
今週末、バックアップジョブ全体を通してファイルサーバーを監視することにしました。ファイルサーバーとBackupExecを実行しているサーバーにRDPdします。ファイルサーバーでタスクマネージャーを開いて、プロセスを表示し、CPUとメモリの使用状況を監視できるようにしました。約60GB相当のバックアップですべてがスムーズに実行されていました。次に、BackupExecのバックアップジョブのバイト数が進行を停止していることに気付きました。 RDPセッションをファイルサーバーに振り返ると、CPUとメモリの使用状況に関するリアルタイムの更新がまだ取得されていました。どちらもほぼ0%で、これは珍しいことです。バックアップは通常、バックアップジョブの期間中約40%の使用率でホバリングします。
この点を繰り返します。画面が更新され、タスクマネージャーがリアルタイムで更新されていました-[スタート]メニューをクリックするまで。画面が真っ暗になり、サーバーがロックされました。実のところ、サーバーはすでにロックされていて、ビデオカードはまだそれを理解していなかったと思います。
私はトリックの袋に戻りました。オフィスに車で行き、サーバーがWindowsのスプラッシュ画面でハングアップしたときに、サーバーを何度もハードリセットしました。起動に成功せずに2時間これを実行しました。動作中の一時ファイルサーバーにすべてを戻すために使用する適切なバックアップがなかったため、パニックに陥り始めました。
やるべきことをすべて使い果たしたら、深呼吸をして、Windows Server 2003 CDを起動し、Windowsの修復インストールを実行しました。サーバーは正常に復旧し、すべてのデータはそのままでした。これでサーバーを自由に再起動でき、サーバーは正常に復旧します。問題は、そのデータを再度バックアップしようとするとすぐに、最初の1つに戻るのではないかと心配していることです。
要約すると、次のようになります。
これがこのサーバーのトラブルシューティングのためにこれまでに行ったことです:
次の仮定を確認または拒否するのに役立ちます:
どんな助けでも大歓迎です。皮肉はほとんど耐えられない。私のデータをバックアップすることはそれを危険にさらしているものです。
2011年11月に投稿-これを試してください:
1)ファイルC:\ program files\symantec\SYNEVENT.SYSを右クリックし、[プロパティ]> [バージョン](タブ)を選択して、バージョン情報を入力します。
2)SymEventインストーラー/アップデーターをダウンロードします: ftp://ftp.symantec.com/public/english_us_canada/symevnt/Sevinst.exe
3)次の記事に従って、SymEventを更新します。 http://www.symantec.com/business/support/index?page=content&id=TECH98521
抜粋:
Windows 2003/XP/2000/NT(サーバーバージョンを含む)でSymeventファイルを更新するには:
A。 SymantecFTPサイトからSevinst.exeをダウンロードします。ファイルをハードドライブ上のフォルダに保存します。
B。コマンドプロンプトを開き、Sevinst.exeファイルをダウンロードしたフォルダーに移動します。
C。プログラムのバージョンに応じて、次のいずれかを実行します。
Symantec AntiVirus 9.x以降を実行しているコンピューターでは、次のコマンドを入力します。
sevinst.exe/log SAVCE
Symantec AntiVirus 8.x以前を実行しているコンピュータでは、次のコマンドを入力します。
sevinst.exe/log NAVNT
D。コンピューターを再起動します
Windowsのスプラッシュ画面でハングアップすると、RAIDコントローラーのファームウェアまたはドライバーがかなり疑わしくなります。それはDellPERCですか?現在、ファームウェアとドライバーを使用していますか?
正常にバックアップされている最後のいくつかのファイルとディレクトリについて何か特別なことはありますか(つまり、バックアップのその時点までのファイルに特徴のないもの)?
ファイルサーバー上のBackupExecリモートエージェントでデバッグログをオンにすることもできますが、ファイルシステムまたはディスクドライバーがフォールダウンしてクラッシュした場合、デバッグログは書き込まれない可能性があります。リモートエージェントサービスを停止し、サービスプロパティの[開始パラメータ]テキストボックスで指定された「-debug」パラメータを使用して開始します(「サービス」を使用している場合MMC snap -これを開始/停止します。「-debug」設定を永続的にする場合は、「HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\BackupExecAgentAccelerator」のImagePath値に追加します。
ドライバーの問題が疑われます。ちょうど同じような経験。レガシーアプリケーションはISDNモデムを使用します。新しいコンピューターに移動し、最新のモデムドライバーをダウンロードしました。
ISDN接続が切断され続け、モデム/回線だと思いました...しかし、結局のところ、最新のドライバを6(!)年前のものに交換し、それ以来問題なく動作しています。したがって、最新のドライバーが常に最良であるとは限りません。壊れていない場合は修正しないでください。
幸運を!
これはオープンファイルの問題である可能性があり、オープンファイルが破損している可能性があります。ウィンドウ(およびその下)ディレクトリを除くすべてをバックアップしてみてください。データだけをバックアップすると、吸盤がフリーズするかどうかを確認してください。また、ディスク容量がある場合は、NTバックアップを使用してディスク間バックアップを実行し、そのファイルをテープにバックアップします。現在のレスキューディスクを作成します。また、ADファイルを手動でバックアップします。
ハングせずにデータをバックアップする場合は、オープンシステムファイルの問題です。それでも問題が解決しない場合は、ExchangeまたはSQLサーバーを実行しない限り、ドライバーまたはハードウェアが疑われます。
テストについて言及しなかったことを思い浮かぶのは、RAMとシステム負荷レベルだけです。
RAMは簡単なはずですが、通常の使用ではトリガーされない不良領域の使用を引き起こすバックアップについて何かがあるかどうかはわかりません-それはちょうど収まりません。
もう1つは、ハードウェアの負荷レベルです。バックアップするときは、ディスクからNICを介して多くの情報を移動します。
RAIDコントローラーをチェックするという提案がすでに1つあります。バックアップの負荷をシミュレートするために大量の転送を実行して、チェックを追加します。また、バックアップの開始時または一定期間の持続的なスループットの後に停止しますか?
NICの負荷については、いくつか試してみます。別のNICを100MBitに強制し、大量のデータをプッシュします(ここでもバックアップの負荷をシミュレートします)。
それらをテストする際の最大の頭痛の種は、それらを個別にテストすることになる可能性があります。テストするのが最も簡単な項目としてNICから始めます。 RAIDコントローラーとは独立して1つ以上の追加ドライブをシステムに投入できる場合は、RAIDコントローラー自体が問題の原因であるかどうかを特定するための良い方法が得られる可能性があります。すべてを非RAIDドライブにコピーして、あなたはそれらをきれいにバックアップすることができます。
最初のロックアップの後に継続/繰り返しロックアップする場合-システムから電源を完全に削除すると問題は解決しますか?電源がオフになっているサーバーが完全にオフになっていないことを忘れないでください。特に、ネットワークインターフェイスはWake-on-LANのためにライブのままである可能性があります。ハードウェアの内部状態が正しくない場合、再起動しただけでは実際にはクリアされない場合があります。
Backup Execでも同様の問題が発生しました(ただし、はるかに古いバージョン10)。最新の更新プログラムをインストールすると、スケジュールされたバックアップの直後または少し後にサーバーがBSODを開始しました。問題の正確な原因を特定したことはありませんが、それはすべてトレンドマイクロにも何らかの形で関係しているようであり、すべて一緒になってメモリ保護障害を引き起こしました。
私の解決策は、以前のBackup Execバージョンに戻し、TrendMicroを更新することでした(officescaneを使用している場合は、最近リリースされた新しいメジャーリリースがあります)。