Pier1、Q9、または同様のホスティング施設でサービスをホスト(同じ場所に配置)したい。
フェイルオーバーハードウェアを別々のキャビネットに配置するのがベストプラクティスですか。あなたの経験では、ホスティングプロバイダーはこれを許可しますか?
私の懸念は、何かが起こった場合、たとえば、キャビネットで発火したり、不満を持ったラックレンターがコークスをサーバーに注いだりすると、両方のHAスタックが危険にさらされることです。
あなたの経験では、私がそれらを別々のキャビネットに置いた場合、それらは同じサブネット上にあることができますか、それとも私がケーブルをあるキャビネットから別のキャビネットに配線することはホスティングポリシーに反しますか?
それとも、このようなイベントが発生することはなく、心配するのをやめるべきでしょうか?
編集:これは、数秒のダウンタイムが非常に有害となる、ビジネス価値の高いステートレスなWebアプリケーションです。
これは、サービスのHA要件によって異なります。
サービスがビジネスにとってそれほど重要でない場合、特にコアネットワーク、ロードバランサーなどの周囲のインフラストラクチャも分割されている場合は、キャビネット間でクラスターノードを分離しても意味がありません。
ビジネス価値の高いサービスでは、フェールオーバークラスター内のノードを分離して消防室を分離するのが一般的な方法であり、ビジネスに価値があり、代償を払う意思がある場合は、そうすることをお勧めします。
はい、ホスティングプロバイダーは、最小のものの1つであり、複数のキャビネットがない場合を除いて、それを許可します。
通常、キャビネット間で独自のケーブルを配線することはありません。プロバイダーは、サービスとしてキャビネット間の相互接続を提供し、コアネットワークをブリッジするか、プロバイダーがネットワークをサービスとして提供する場合があります。
クラスタ内のノードは同じVLANを使用する場合がありますが、クラスタリングテクノロジ自体と、おそらく共通ストレージに加えて、 [〜#〜] spof [〜#〜] として残ります。これらのコンポーネントでサービスが失敗するのを防ぐには、災害復旧システムを自分で構築する必要があります。これは通常、地理的に十分に離れた場所にあり、サービスが非同期にミラーリングされます。
単一ラックの電源障害は、リストした他のほとんどの懸念事項よりも一般的です。単一のPDUストリップが飛び出したり、回路が過負荷になったりします。これは数回発生しましたが、リストした他の問題はありません。 。
理想的には、「HA」ソリューションは2つの異なるデータセンターを使用します。 (例:AWSリージョン内の2つのゾーン)
必ずしも。それはあなたが現実的に保護したい状況のタイプに依存します。
HA戦略が複数のキャビネットに並列アプリケーションスタックを構築することであったいくつかの環境がありました。これは、アプリケーション/サービスのすべての層を意味しました。スイッチング、ファイアウォールなどが2つのキャビネットに存在していたため、アプリケーションの可用性に影響を与えることなく、ラック全体(またはその中のコンポーネント)を1つ失う可能性がありました。
アプリケーションの範囲や性質を指定しません。詳細はそこで役立ちます。しかし、単一のWebサーバーのような小さなものについて話している場合、これは必要ありません。地理的な分離、DNSフェイルオーバー、および個々のサーバーに内部冗長性(デュアル電源、冗長ファン、RAID)があることを確認することは良いスタートです。
施設内のキャビネット間(クロスコネクト)でケーブルを接続することは珍しいことではありません。通常、これは連続したスペースを取得できない結果です。しかし、技術者が液体飲料をラックにこぼしたり、火事を起こしたりする心配はありません...ただし、 コンポーネントの火災が発生する可能性があります = ...しかし、ダウンタイムを回避するために、フェイルオーバーインフラストラクチャスタック全体がありました。
場合によります。あなたが説明する問題はまれですが、あなたの恐れは合理的です。
別の建物/都市ではないにしても、別のラックに冗長ユニットを配置する方が確かに良いと思います。隣接するラックに冗長サーバーを配置するためだけに余分な費用がかかるかどうかはわかりません。しかし、コストが同じであれば、それは害にはなりません。
ホスティングプロバイダーは、キャビネット間で独自のケーブルを配線することを許可しません。ただし、2つのネットワークポート(各キャビネットに1つ)を同じVLANに配置するため、重要な場合は同じサブネットを使用できます。
あなただけがあなたにとってどんな失敗が価値があるかを決めることができます。それを理解したら、心配する価値があるかどうかがわかります。
あなたが言及した火災や妨害行為、または他の同様の環境問題のリスクは、それらの間のケーブルを実行可能にするのに十分近いラックに技術を配置することによって適切に軽減される可能性は低いです。昨年のニューヨーク地域での嵐について考えてみましょう。データセンター全体がグリッドから外れていました。
クラスタメンバー間に適切な分離がない限り、または少なくともこれが通常のエラーの実行に対処するために実装されていることが非常に明確である場合を除いて、HAについてあまり心配する価値はないことをお勧めします(サーバーなど)よりエキゾチックなものではなく)。
レジリエンスの重要なポイントは、必要に応じて深くまたは浅くすることができる(または資金を持っている)ことです。それと技術的に同等なのは、必要なだけユニキャストまたはマルチキャストできることです(または資金があります)。
ビジネスに回復力の要件がある場合、ビジネスはその回復力がどこまで提供されるべきかを特定します。毎日5分必要なネットワークがある場合、復元力にはどのようなメリットがありますか?ネットワークが病院であり、24時間365日関連している場合は、まったく異なる目的があります。
私は、元シスコの従業員が要件と私がしなければならないことを指示しようとしたが、ビジネス/クライアントが必要とするものではなくインフラストラクチャを見て誤解している環境で働いてきました。
完全な回復力が必要な場合は、ビジネスがコストを満たします。あなたがしない場合は、気にしないでください。
それは本当に他の誰かの決定です。