web-dev-qa-db-ja.com

マルチパスのパフォーマンスが非常に悪いRHEL / HSV200

Multipath @ HSV200ストレージシステムでRHEL5.5を実行しています。

書き込みのディスクパフォ​​ーマンスは、(同じストレージとマルチパスを使用している)Windowsシステムの対応物と比較して非常に劣っています。

結果は次のとおりです。

mpath17 (3600508b400105f9d0002100000780000) dm-12 HP,HSV200
[size=850G][features=0][hwhandler=0][rw]
\_ round-robin 0 [prio=100][active]
 \_ 2:0:1:30  sdaw       67:0   [active][ready]
 \_ 1:0:1:30  sdc        8:32   [active][ready]
\_ round-robin 0 [prio=20][enabled]
 \_ 2:0:0:30  sdau       66:224 [active][ready]
 \_ 1:0:0:30  sda        8:0    [active][ready]

`atop` result:

LVM |      mpath17  | busy     99% |  read    3077 | write      6  | KiB/r     90 |               | KiB/w      4 |  MBr/s  27.11 | MBw/s   0.00  | avq     2.41 |  avio 3.21 ms 

「ビジー」が99%であることに注意してください。これは、ほとんどの場合に発生します。

Multipath.confは、このストレージに推奨されるHPのベストプラクティスを使用しています。

device {
                vendor                                   "HP"
                product                                  "HSV2[01]0|HSV3[046]0|HSV4[05]0"
                path_grouping_policy        group_by_prio
                getuid_callout                      "/sbin/scsi_id -g -u -s /block/%n"
                prio_callout                           "/sbin/mpath_prio_alua /dev/%n"
                path_selector                       "round-robin 0"
                path_checker                       tur
                hardware_handler              "0"
                failback                  immediate
                rr_weight                               uniform
                rr_min_io                              100
                no_path_retry                       18
}

このイベントを診断する方法はありますか?このシナリオのボトルネックはどこにあるのかを理解したいのですが...どこから始めればよいのでしょうか。

(これはここでの私の最初の投稿です、どうもありがとうございました)

1
Daniel Sartori

これは、パフォーマンスの問題の症状である可能性があります。このLUNの背後にあるストレージはどのように構成されていますか?どのディスクタイプ、いくつのディスク、そしてどのRAIDタイプですか?キャッシュはライトバックに設定されていますか?

コメントで、ディスク使用率をMB /秒で定量化しているとおっしゃいましたが、ほとんどの場合、非SSDドライブの制限はMB /秒ではなく、IO /秒です。ランダム読み取り。

0
Basil

全体の問題はディスクコントローラーでした。キャッシュコントローラーがなかったため、大量のファイルの書き込みや多数のファイルの同時書き込みなど、さまざまな点でパフォーマンスが低下しました。

診断ありがとうございます。

0
Daniel Sartori