最も適切な高可用性オプションを決定するために、私たちはダウンタイム(計画的または計画外)の削減に焦点を当てています。フェールオーバークラスターインスタンス(FCI)に関する統計(多くのMSDNドキュメントとブログを読んだことから)を収集することができました。
私が見つけられなかったのは、可用性グループのフェイルオーバー統計/時間に関するドキュメントです。
比較として(FCI):
2008R2クラスターのフェイルオーバーの範囲は30秒から5分です(トラフィック量とハードウェア/ネットワークの設定に応じて):
手動フェイルオーバーを実行すると、LUNへの書き込みが完了し、LUNが新しいアクティブノードに切り替えられ、新しいアクティブノードでSQL Serverインスタンスが起動します。
自動フェイルオーバーを実行する場合、ノードの起動後、データベースの整合性チェックが実行され、処理中のトランザクションがロールバックされます。
可用性グループ
同じハードウェアとトラフィックのボリュームを比較すると、可用性グループがより迅速にフェイルオーバーできるはずであることを理解しています。
私が見つけられなかったものは、2つを比較する実際の実際のメトリックです。
具体的には、アクティブに使用されている可用性グループのプライマリ書き込みノードのフェイルオーバーにかかる時間について、誰かがmetricsを持っていますか?
(同期セカンダリへのフェイルオーバー)理想的には、これにはMicrosoftまたは信頼できるソースへの参照が含まれます。意見に基づくのではなく、メトリックのみを使用してください。
FCIとAGの両方のフェイルオーバーの経験から得られた、合理的な大量トランザクションシステム(40k trx /秒)による個人的な観察。それぞれについて、サイズが500MBから4TBの6つのデータベースを検討してください。フェイルオーバーにリストされている時間は、データベースが起動し、新しいノードで書き込み可能な状態になるまでの時間です。あなたの走行距離は変わる可能性があり、変わるでしょうが、これは少なくともあなたにとってのデータポイントです。
クラスターのフェールオーバー:47秒(平均)
AGフェイルオーバー:10秒