12 x 300gb DP SASドライブを搭載したiSCSIHP P2000があります。これは、XenServerを実行している64gb RAMを備えた2台のDL385サーバーに接続されています。SANネットワークは2ギガビットスイッチを介してマルチパスされます(P2000から各スイッチへの4 x銅線リンク、各XenServerには各スイッチへの銅線リンクがあります)
最近、インストール時の決定を再評価して、RAID-5とRAID-10の2つのvdiskを作成しました。 RAID-5は無意味であると判断して破壊し、それらのディスクを使用してRAID-10を2つのホットスペアディスクを備えた1つの大きなアレイに拡張しました。
それが行われてから(1週間ほど前)、ディスクのパフォーマンスは非常にひどいものになりました。両方のXenServerホストでtop
を見ると、最大15%のI/O待機が示されています。 VM内のhdparmは、SANからの1.12MB/s
読み取りを示します。
SANにも接続されている他の2台のWin2008R2マシンがあります。以前のパフォーマンステストでも大きな違いが発生していることが示されているため、XenServerホストで問題になるとは思われません。
~24.75MB/s
、現在は1.67MB/s
の8kランダム読み取り~170MB/s
、現在は3.61MB/s
の64kのランダム読み取りRAID拡張が完了し、SMUではすべてが「OK」です。 XenServerは非常に「空」です(一方に7つのVM、もう一方に4つのVM)が、実稼働環境です。
さらに調査した結果、問題は誰か(咳)がSANでフロー制御を有効にし、まったく同じハードウェアについて話し、フロー制御を明示的に奨励するインターネット記事のアドバイスをオンにすることでした。使用する。
フロー制御を無効にした後、負荷平均とI/O待機はすぐに減少し、24時間後、いくつかの苦労しているメンテナンスタスクが完了すると、完全に通常に戻ります(0.0%waおよび負荷平均<0.10)。