web-dev-qa-db-ja.com

Windowsフェールオーバークラスターパブリックとハートビートを単一のNICで実行しても安全ですか?

ファイバー接続された共有ストレージにクォーラムディスク監視を備えた2ノードWindowsフェールオーバークラスター(Windows Server 2016、SQL Server 2017)があります。

このQuorum設定でハートビートが独自のネットワーク上にあることはどのくらい重要ですか。なぜですか。

ネットワーク自体がダウンした場合、Quorum Disk Witnessは、フェイルオーバーを試みるノードを停止し、両方のノードがオンラインであると投票しますが、ノード自体がもう一方がオフラインであると言っていると思いますか?

このシナリオでは、独自のネットワークでハートビートを実行することの利点がわかりません。 2つのNICをチーム化することで回復力が得られることは完全にわかりますが、このクォーラムセットアップでは、ハートビートを分離しても(私の知る限り)あまり効果がありません。

6
Gavin

このQuorum設定でハートビートが独自のネットワーク上にあることはどのくらい重要ですか。なぜですか。

さて、あなたの質問は本当に議論の余地があります。また、クォーラムは、クラスターネットワーク構成自体にはほとんど意味がないことも付け加えておきます。 Windows Server 2008以降、Microsoftは、ハートビートネットワーク接続なしでWSFCを続行して構成できると述べています。ハートビート専用のネットワークを構成していない場合、クラスター検証ウィザードは警告を表示するだけで、クラスターは引き続きサポートされます。さて、しかしそれはこれがすべて良いことを意味するのではありません。専用の理由を引用させてくださいNIC for heatbeat( Source

ハートビート通信は、ノードの障害を検出するためにノード間のヘルスモニタリングに使用されます。ハートビートパケットは、本質的に軽量(134バイト)であり、遅延に敏感です。クラスターのハートビートがSaturated NICによって遅延したり、ファイアウォールなどによってブロックされたりすると、クラスターノードがクラスターメンバーシップから削除される可能性があります。クラスター内通信は、クラスターの状態が変化したすべてのノードにわたってクラスターデータベースを更新するために実行されます。クラスタリングは分散同期システムです。このネットワークの遅延により、クラスターの状態変化が遅くなる可能性があります。

したがって、上記を読んだ場合、ハートビートコミュニケーションが依然として重要である理由をある程度理解することができます。

Windows Server 2016を使用しているため、ネットワークバインドの順序(どのネットワーク/ルートを優先するかを指示する順序)を気にすることなく、ハートビート通信を簡単に実行できます。デフォルトでは、Windowsサーバー2016はInterface Metric優先度が最も高いルートを決定するネットワークアダプターのプロパティ。インターフェースメトリックプロパティの値が低いほど、優先度が高くなります。この詳細情報 サポート記事

また、ハートビートネットワークがダウンしても、WSFCがクラスター通信にパブリックネットワークを使用し始め、クラスター通信が継続する場合は、ハートビートネットワークを構成するためのオーバーヘッドはそれほど大きくないと思います。ハートビートネットワークを使用して、物事を分離し、クラスター通信をより安全にすることがより重要だと思います。ただし、パブリックネットワークが適切にチーム化されており、クラスターとクライアントの両方の通信に簡単に対応できる十分な帯域幅がある場合は、ハートビートネットワークなしで必ず先に進んでください。パブリックネットワークしかない場合は、クライアントと内部クラスタのすべての通信がこのリンクを経由するため、強力でなければなりません。

MVP、MCM Edwin Sarmientoがハートビートネットワークについて述べたことは次のとおりです( Source

しかし、これが私の見解です。チーム化されたノードごとに複数のNICがある場合でも、ネットワークスイッチが冗長であり、高可用性であることをどのくらい確信していますか?サーバーのみがテストされ、基礎となるネットワークアーキテクチャはテストされないDRの演習を見てきました。ネットワークスイッチ自体に障害が発生した場合にのみ、彼らはそれらがまったく高可用性ではないことに気づきます。ハートビート通信専用のネットワークを使用することをお勧めします。お客様がネットワークレイヤー(スイッチ、ルーターなど)の高可用性を保証できる場合は、NIC =チーミングの実装(したがって、ハートビート専用のネットワークがある理由)

私は彼が正しいと信じています、焦点は「完全なネットワーク」をその一部だけでなく冗長にすることにもっと焦点を当てるべきです。

ネットワーク自体がダウンした場合、Quorum Disk Witnessはノードがフェイルオーバーを試みるのを停止し、両方のノードがオンラインであると投票しますが、ノード自体がもう一方がオフラインであると言っていても、私は正しいと思いますか?

ネットワークとは、完全なパブリックネットワークがダウンしていることを意味します。その場合、これはWSFC全体をダウンさせる単一障害点になる可能性があります。そして、これは正確にエドウィンが上記の引用で強調したものです。 Nodeクォーラムディスク(> 50%)WSFCはオンラインのままで、フェールオーバーを行います。SANクラスターパブリックネットワーク経由ではなく接続されているため、このネットワークの問題はディスク/ストレージに影響しません。

追加の読み:

Windows Server 2008ネットワーキング3パートシリーズ

免責事項:私はネットワークエンジニアではなく、WSFCのネットワーク構成の詳細な議論は私の知識の範囲内になく、ネットワークエンジニアが間違いなくこの回答にさらに追加できると信じているので、私の知識の及ぶ限り質問に回答しようとしました。お役に立てれば。

3
Shanky

ハートビートネットワークとクォーラムとは何かを定義してみましょう。

ハートビート(プライベートクラスターネットワーク)は、他のクラスターノードとのみ通信するために使用されます。ハートビート専用のネットワークを用意して、クライアントが接続するパブリックネットワークからトラフィックを分離し、ネットワーク遅延を回避することをお勧めします。クラスタノードは1秒ごとにハートビートを交換し、5回の応答がない場合、ノードはダウンしていると見なされます。

Quorumは、クラスターでスプリットブレインが発生しないようにするための投票メカニズムを提供するために使用されます。 クラスターノードネットワークが互いに通信できない場合、クォーラムはタイブレーカーとして機能します。で、何らかの理由でクォーラムが失敗するか破損すると、クラスター全体がシャットダウンします。

復元力、冗長性、サービス品質、分離のために専用のハートビート(プライベートネットワーク)を構成し、ネットワークの単一障害点を回避することは非常に重要であり、推奨されています。ハートビートネットワークを持たないWSFCをセットアップする目的に反します。クラスターネットワークの目的は、Quality of Serviceを達成することです。

1
user37701