web-dev-qa-db-ja.com

SANからのクラスター共有ボリュームファイルのコピーのパフォーマンス

誰かが奇妙な問題で私を助けてくれることを願っています。

Server 2008R2とEquallogicPS4000SANを使用してMicrosoftフェールオーバークラスターを実行しています。主な構成では、クラスタに2台のDell PoweredgeT710サーバーがあります。 CSVとQuormの設定があります。サーバーにはそれぞれ10個のBroadcom1GbNICがあります。現在、4つのNICがSANにアクセスするためのiSCSIネットワーク上にあります。 MPIOとDellHITパックを使用します。

各ノードで5つのVMが実行されており、すべてがスムーズに実行されます。目立ったパフォーマンスの問題などはありません。 SAN)から、各サーバーから各ボリューム(CSVおよびQuorm)への4つのiSCSI接続を確認できます。これもパフォーマンスが優れているようです。

私が直面している問題はバックアップにあります。 backupchainやVeeamのようないくつかのバックアッププログラムを試しました。問題は、どちらもVMのバックアップに非常に時間がかかることです。たとえば、クラスターで実行されている500 GB(固定ディスク)のVHDがあります。そのVHDのバックアップには18時間以上かかります。これは、圧縮とデパッピングがオフになっているため、断食されているはずです。

バックアップ専用の別のサーバーもあります。ダイレクト接続ストレージがたくさんあります。トラブルシューティングの一環として、そのサーバーをノードとしてクラスターに取り込むことにしました。これでCSVにアクセスでき、VHDが存在するC:\ clusterstorage\volume1から読み取ることができます。このバックアップサーバーにはNICが2つしかありません。 1 NICはiSCSIネットワークに接続され、もう1つはメインネットワーク上にあります。MPIOやチーム化なしでIntelNICSが含まれています。

そのため、3番目のサーバーがクラスター内にある状態で、ベンチマークを開始しました。 CSVに保存されている約7GBのテストVHDがあります。そのVHDを3つのサーバーすべてから、それぞれのサーバーの直接接続されたストレージにコピーするファイルをテストしました。クラスタのメインノードである2台のDellサーバー(VMを収容)は、約20Mbs /秒でそのファイルを読み取っています。その速度でバックアップを遅くする方法はどれですか。 1 NICからSANまで)が約100Mbs /秒で読み取られているもう1つのサーバー。

私は今日、これについてデルと電話で数時間を過ごしました。私たちはあらゆる種類のテストを経て、彼はかなり馬鹿げた設立者でした。彼は、1 NICのみのサーバーが、4つのNICSとMPIOを備えたサーバーの約5倍の速度で読み取っている理由を本当に理解していません。

ファイルのコピーが行われている間、NICのネットワーク使用率を調べました。 4つのNICを備えたサーバーでは、ファイルのコピー中にアクティビティがわずかに増加しましたが、4つのNICすべてで最大で約8〜10%しか増加しませんでした。 1 NICのもう一方のサーバーは、ファイルのコピー中に80%を超えてジャンプしました。

営業時間後にさらにテストを行い、明日デルに電話をかけ直す予定ですが、これらのサーバーでCSVへのファイルコピーアクセスを高速化できない理由は本当に混乱しています(デルのサポート担当者もそうです)。

誰かがこれについて何か意見がありますか?フィードバックをいただければ幸いです。

前もって感謝します。

3
Sequenzia

ご提供いただいた情報から、バックアッププロセスでCSVがリダイレクトアクセスモードになっているようです。バックアップソフトウェアがCSVに対応しておらず、リソースを所有していないサーバーを介してVHDファイルにアクセスしようとしている可能性があります。

これは、フェールオーバークラスターマネージャーの[ストレージ]の下にあるCSVを表示することで確認できます。

この場合、Veeamに連絡して、クラスター化されたHyper-Vバックアップの実行を推奨する方法を確認します。

リダイレクトされたアクセスの詳細については、こちらをご覧ください: http://blogs.technet.com/b/askcore/archive/2010/12/16/troubleshooting-redirected-access-on-a-cluster-shared-volume -csv.aspx

2
Doug Luxem

これは、誤って構成されたMPIOセットアップのように聞こえます。あなたのサイトで何時間も費やさずに正確な問題を特定することは不可能ですが、ここにチェックアウトするためのいくつかの指針があります:

  • LUNを表示するようにEquallogicはどのように構成されていますか?アクティブ/パッシブまたはアクティブ/アクティブを実行していますか? ALUAを使用していますか? ALUAでない場合は、パスのトラッシングが発生している可能性があります。これにより、大量のI/O中にSANがひざまずくようになります。
  • ジャンボフレームを使用していますか?はいの場合(またはわからない場合)-すべてのデバイスのSAN、スイッチ、およびNICをチェックして、MTU設定がすべての場所で同一であることを確認します

尊敬されているすべてのSANベンダーは、さまざまな使用シナリオのベストプラクティスを提供しています。iSCSIを搭載したWindows上のMPIO用のベストプラクティスを見つけることができるはずです。

1
pauska