web-dev-qa-db-ja.com

スモールオフィスの質問におけるHAサーバーのDRBD

背景:小規模オフィス環境でHAサーバーが必要であり、それを提供するためにDRBDを検討しています。 HAサーバーに必要な容量は約100GBしかないため、サーバーの負荷は非常に低くなります。古いオフィスデータをアーカイブした場合、データはおそらく年間約10%〜25%増加し、アーカイブしない場合は毎年50%〜75%増加します。

重要なのは、消費者向けと中古のエンタープライズ向けのハードウェアを組み合わせて使用​​していることです。これは、先制的に計画しないと問題になります。構築済みの高品質サーバーは失敗するので、冗長サーバーが道のりのようです。

計画:私たちは、(2)最高の使用済みサーバーを見つけて、それらを同期するのが良いと考えています。必要なのは、SATA/SAS対応のサーバーと、価格で可能な限り多くのドライブ用のスペースです。これらのサーバーは、取引が成立した場合、100ドルから200ドル(+一部の部品と追加のドライブ)で購入できるようです。

これは理論的にはサーバーに障害が発生する可能性があることを意味し、サーバーに到達するまでに数日かかる場合、偶然の障害が発生しない限り、IT部門(私)がサーバーに到達するまで事態は悪化します。私たちはDebianをOSとして使用します。

いくつかの質問

  1. (A)DRBDはドライブまたはコントローラーの障害をどのように処理しますか?つまり This はストレージドライバーの前にDRBDを示しているので、コントローラーに障害が発生してダーティデータを書き込んだり、ドライブに障害が発生してもすぐにクラッシュしない場合はどうなりますか?データは他のサーバーにミラーリングされていますか?このような場合、サーバー間でデータが破損するリスクがありますか?

  2. (B)DRBDの失敗点は何ですか。これは理論的には、1台のサーバーが稼働している限り、問題は発生しません。しかし、問題があることはわかっています。理論的にはほとんどがソフトウェアである必要があるため、DRBDを使用した失敗モードは何ですか?

  3. このために2つのサーバーを使用する場合、データベースとWebサーバーのレプリケーション用にMYSQLとApacheを使用してそれぞれでVMを実行するのが合理的でしょうか。 (私はそう思います)

  4. DRBDは十分に信頼できますか?そうでない場合、信頼性は特定のタスクに限定されていますか、それともよりランダムですか。検索するとさまざまな問題を抱えている人が見つかりましたが、これはISインターネットで、良い情報よりも悪い情報の方が多いようです。

  5. データがLAN経由で同期されている場合、DRBDは2倍の帯域幅を使用しますか?つまり、NICSを2倍にして、リンクアグリゲーションとトランキングを行う必要がありますか?次に、それらを別々の回路の別々のルーターに配置し、UPSを別々の部屋に配置すると、冗長性が実際に得られます。

  6. サーバー管理の観点から、これはオフィスにとってあまりにもクレイジーですか?より単純なREALTIMEの代替手段はありますか(許可されたDRBDは理論的には単純に見えます)。

すでにサーバーがあります。したがって、DRBD専用のドライブを備えた2番目のUSEDサーバーは、スマートな買い物をすれば、150ドルから250ドル程度で簡単に手に入れることができるように思えます。 2台目のルーター、ドライブ、NIC(中古)、および(2)UPSを追加し、1,000ドル+/-を話していました。それは比較的安いです!そして、これが主にサーバーの障害時に私たちに時間を費やしてくれることを願っています。最近のRAIDでは、ドライブの障害を処理する方が簡単なようです。懸念されるのは、診断と修正にダウンタイムが必要になる可能性がある、コントローラー、メモリ、電源などの他のハードウェア障害です。

サーバーが冗長であるということは、サーバーを修復するためにすべてを停止する必要があるのではなく、スケジュールが許せば問題を修正するための稼働時間と柔軟性が向上し、使用済みハードウェアがより実行可能になることを意味します。

うまくいけば、これらの質問には簡単に検索できる答えがあることを見逃していません。すばやく検索しましたが、探しているものが見つかりませんでした。

7
Damon

まず、「HA」が何を意味するのか本当にを定義する必要があります。タイプXと期間Yの停止のコストはどのくらいですか?それはあなたの組織にどのように影響しますか?とにかくこの組織でのあなたの役割は何ですか、そしてあなたの時間の価値は何ですか?これにどのくらいの時間を費やすことができますか?その後、この要件でこの種のソリューションが許可されるかどうか、または他の何かが必要かどうかを判断する必要があります。

第二に:私の世界では、「私はHAが必要です」と「私は200ドルでくだらない中古サーバーを購入するつもりです」という文はおそらく合わないでしょう(実際、私にとっては中古のがらくたを購入し、あらゆる種類の専門的な使用はしませんtはまったく合わない)。

とにかく、あなたの質問:

  1. 完全に新しいデータをDRBDブロックデバイスに書き込むと、壊れていないコントローラーに正しく書き込まれます。これは、ソフトウェアRAIDまたはLVMと同様に、実際のディスクの前にある完全に透過的なレイヤーです。ただし、コントローラーの破損やディスクからの読み取りエラーが原因でプライマリノードでデータが破損している場合、書き込み操作は読み取り-変更-書き込みサイクルであることが多いため、これはセカンダリノードに簡単に伝播する可能性があります。破損したデータはプライマリノードで読み取られ、このブロックの書き込み操作が両方のノードに送信されます。これにより、DRBDを使用する際の最も重要なポイントが浮かび上がります。RAIDと同じですが、信頼性の高い優れたバックアップの代わりにはなりません。

  2. ここで何を意味するのかわかりません。

  3. シングルノードセットアップでVMを使用すると便利な場合、それは2ノードセットアップでも使用され、正しく実行されるとライブマイグレーションが可能になるという利点があります。

  4. 私の経験では、そうです。ただし、環境で徹底的にテストし、システムが経験し、それらから回復する方法を学習および文書化できるさまざまな障害状態のシミュレーションに多くの時間を費やす必要があります。信頼性はありますが、DRBDは自己回復型ではなく、障害状態から回復するには状況を十分に理解する必要があります。

  5. あなたは本当にノード間の専用接続が必要です。 2ノードのセットアップでは、これはスイッチなどを使用しないポイントツーポイント接続にすることができます。他のすべては技術的に可能かもしれませんが、ただナンセンスです。使用パターンによっては、この専用リンクにトランキングまたはより高速なNIC(10GイーサネットやInfinibandなど)を使用することが有益な場合がありますが、読み取りまたは書き込みするデータのほとんど/すべてがLANインターフェイスからのものである場合、これは役に立ちません。とにかくLANによって制限されます。

  6. これは私の最初の段落に戻ります:あなたはそれから何を期待し、あなたはHAをどう思いますか?経験豊富なシステム管理者にとっては、さまざまな障害から保護するための安価で信頼性の高い方法ですが、パーツがどのように組み合わされているかについての基本的な理解が必要です。そのような経験豊富なフルタイムのない多くの小さな店SAは、高品質のハードウェアと優れたサポート契約を持っている方が良いです。

最後に、現在のハードウェアにHAソリューションを遡及的に適合させようとしないでください。私が書いたように、あなたはセットアップとその失敗条件を実験する時間を必要とします。これには多くのダウンタイムが必要であり、本番ハードウェアで合理的に行うことはできません。

7
Sven