このWindowsServer 2008 R2ドメインコントローラーを物理的なDellサーバー、モデルPowerEdgeR510で実行しています。
このあたりにはいくつかの電気的な問題があるため、残念ながら、停電は非常に一般的な発生です。 UPSはありますが、信頼性が低く、サーバーがクリーンでないシャットダウンを経験することがあります。
何らかの理由で私は本当に理解できません、時々この特定のDCは汚れたシャットダウンの後に現れて SNロールバック に遭遇し、それを降格して宣伝することを余儀なくされますバック。
サーバーは物理サーバーであり、スナップショット、クローン作成、復元が実行されたことがないため、これはまったく意味がありません。また、追加のソフトウェアはインストールされておらず、DCの義務のみを実行します。具体的には、複製/回復/存在するソフトウェアはありません。
ファイルシステムの破損は少なくともある程度は意味がありますが、サーバーを以前の状態に戻す方法がないため、USNのロールバックは実際には意味がありません。ただし、これは過去2か月間に少なくとも3回発生したため、1回限りのクレイジーなイベントではありませんでした。しかし、私は完全に説明を思い付くことができません。
この問題の理由は何でしょうか?
今日はこれを数時間考えました。少し困惑しますが、コメントで示したように、停電/ダーティシャットダウンがキャッシュの内容を一掃する前に、ディスクにコミットされていない何らかのディスクキャッシュが実行されていると推測されます。 ...または、ntds.ditを格納しているRAIDボリュームで実行しているため、停電により、RAIDボリュームが一時的に壊れたり、一時的であっても一貫性が失われる可能性があります。
USNロールバックのパーティラインは、a DCが以前の状態に復元されたときであり、典型的な例は仮想化されたDC =スナップショットから。正確には当てはまらないことはわかっています...しかし、書き込みキャッシュを備えたディスクの場合でも、ディスク上に物理的に存在するデータには「前の状態」が含まれていると考えることができます。 「書き込みキャッシュは、実際にはDCの最新の状態を含むものですが、2つの状態がわずか0.5秒離れている場合でも。
マイクロソフトからのこれらのコメントについて反芻します。
仮想SCSIディスクは、仮想IDEと比較してパフォーマンスが向上し、強制ユニットアクセス(FUA)をサポートします。FUAは、オペレーティングシステムがすべてのキャッシュメカニズムをバイパスしてメディアから直接データを読み書きすることを保証します。
DCはVMではありませんが、概念は引き続き適用されます。ディスクキャッシュとDCが混在することはありません。そのため、Active DirectoryをインストールするとWindowsポリシーとして書き込みキャッシュがオフになりますが、ハードウェアRAIDコントローラーなどにキャッシュメカニズムを含めることができます。
シナリオB:壊れたミラー内の他のドライブからActiveDirectoryを起動する
ドメインコントローラーをプロモートします。ミラーリングされたドライブでNtds.ditファイルを見つけます。
鏡を壊しなさい。
ミラーの最初のドライブにあるNtds.ditファイルを使用して、インバウンドレプリケートとアウトバウンドレプリケートを続行します。
ミラーの2番目のドライブにあるNtds.ditファイルを使用して、ドメインコントローラーを起動します。
これは、RAID1ボリュームを備えた物理DCで私を苦しめたレプリケーションキラーです。私は個人的にそれによって引き起こされた実際のUSNロールバックを経験したことはありませんが、それはそのDCでのレプリケーションを強制終了します。つまり、2つのディスクからなるRAID1ボリュームを想像してみてください。 1台のドライブが停止します。それを削除し、新しいドライブを挿入します... aaaaaaおよびDSA書き込み不可。
AskDSブログ から:
VMホストまたはActiveDirectoryデータベースが存在するストレージディスク用の無停電電源装置(UPS)がない場合は、仮想マシンのホストコンピューターで書き込みキャッシュが無効になっていることを確認してください。追加のガイダンスについては、このリンクを参照してください。逆に、DCをホストするVMホストに対して書き込みキャッシュを有効にしておく必要がある場合は、DCへの損傷を避けるためにUPSをインストールします。
繰り返しになりますが、仮想化DCについて説明していますが、ディスクキャッシュの概念は物理DCにも適用されます。
だから私の考えがあります。それはあなたのストレージシステムと関係があると思います。少なくともntds.ditボリューム、特にで、停電が発生しやすい場合は、すべてのキャッシュメカニズムを無効にする必要があります。