web-dev-qa-db-ja.com

Performance Manager-どのカウンター?

現在、従来のサーバー環境からSAN/VMWare環境への移行を検討しています。

メインサーバー(DC、ファイルサーバー、Exchange)のパフォーマンス統計を収集して、環境で実行可能かどうか、またはSANパフォーマンスの問題が発生するかどうか)を確認するように依頼されました。 。

私は8時間にわたっていくつかのスケジュールされたベースラインを実行し、多くのカウンターを含めましたが、結果のログは大きすぎて役に立ちません-perfmonがそれらを開くか、異なるカウンターを表示できるようになるまでに約3分かかります。

私は一般的に、パフォーマンスを確認するのに役立つものを知っていますが、それを監視するのに適切なリストは何であり、それは私たちに有用な出発点を与えます。また、どのカウンターがこれに役立つでしょう。

考えています

  • CPUパフォーマンス
  • ディスク/ファイル
  • ネットワークの使用
  • アクティブディレクトリ(GPO、ログオンなど)

しかし、どのカウンターが最も役立つでしょうか。また、特に懸念の対象とすべき領域はありますか?

4
Tubs

もう少し調査した後、これはカウンターの優れた一般的なリストだと思います。

論理ディスク

  • 平均ディスク秒/読み取り
  • 平均ディスク秒/書き込み
  • % アイドルタイム

記憶

  • 使用中の%コミット済みバイト
  • 使用可能なメガバイト
  • 無料のシステムページテーブルエントリ
  • ページ/秒
  • 非ページバイトをプールする
  • プールページバイト

通信網

  • 合計バイト数/秒
  • 出力キューの長さ

物理ディスク

  • % アイドルタイム
  • 平均ディスク秒/読み取り
  • 平均ディスク秒/書き込み
  • ディスクキューの平均長
  • 平均ディスクバイト/秒

処理する

  • ハンドル数
  • プライベートバイト
  • スレッド数

プロセッサー

  • %割り込み時間
  • %プロセッサ時間
  • %ユーザー時間

システム

  • プロセッサキューの長さ
  • ターミナルサーバー(オプション)
  • アクティブセッション
  • 非アクティブなセッション
  • 合計セッション
3
Tubs

あなたを殺す可能性が高い大きなものはディスクIOです。 1秒あたりのトランザクション数と1秒あたりの読み取り/書き込みセクターの両方を収集することで、SANで必要なものを決定するための開始点が得られます。ディスクに悪い影響を与える可能性のあるメモリとページファイルの使用量にも注意してくださいIO stats、そしてVMに追加のメモリをプロビジョニングするのは簡単です。

ネットワークはおそらく次に重要なものですが、それは非常に単純です。転送と1秒あたりのパケット数を集計し、それほどばかげていないことを確認してください。

私の経験では、CPUは最新のシステムで最も可能性の低いボトルネックです。 CPUを一貫してペギングしている複数のマシンがない限り、私はそれについて心配しない傾向があります。 CPUが不足している場合は、追加のVMサーバーをプロビジョニングするのは簡単です。

3
womble

ディスクバウンドの場合、各物理ディスクの「\ PhysicalDisk(...)\ Current DiskQueueLength」を監視するのが好きです。

Perfmonで物事を表示する際の問題について:これはあなたがしていることの範囲外かもしれませんが、私はcheck_ntプラグインとクライアントにインストールされたnsclient ++を使用してNagiosでWindowsカウンターを監視します。次に、 n2rrd を使用してすべてをグラフ化できます。また、rrdtoolを使用してカスタムグラフを作成することもできます。

リストしたものはすべて、vmware/san環境で実行されることがよくあります。 SANと仮想サーバーがどれほど強力である必要があり、適切なアーキテクチャである必要があるかという問題です。高価なsanに現金を費やしても構わないと思っているなら、ベンダーはできるはずです。あなたが必要なものをあなたに伝えるために。

2
Kyle Brandt

使用状況にもよりますが、ディスクIOとネットワークは、VMWareタイプのインフラストラクチャへの移行における最大の懸念事項のようです。特に、VMがSANに保存されている場合は、移行するすべてのマシンのネットワーク使用量とディスクの評価IO。VMWareタイプの使用法のほとんどのサーバーには、かなりの数のNICが付属しているはずですが、それでも、いくつできるかを覚えておく価値があります。 VMWare ESXは、すべてのディスク変更をすぐにVM)に書き戻さない機能をサポートしているため、その方法でパフォーマンスをいくらか節約できます。

カイルが言ったように、パフォーマンスにアクセスするために使用したパフォーマンスの測定 RRDTool 、これは本当に便利です。

2
PixelSmack

仮想マシンは、さまざまな領域で問題が発生するという点で、通常のサーバーとは異なります。ほとんどの場合、CPUはボトルネックのリソースではありませんが、RAMはボトルネックのリソースです。始める前に本当に知っておくべきこと:

  • ディスクスループットストレージをどのくらいの速さで叩きますか? MB /読み取り、MB /書き込みの平均とピークの両方(このスレッドの他の場所で説明されているように、RRDToolはこれに適しています)。ピークがいつであるか、およびそれらが同じESXクラスターに格納されている他のVMのI/Oピークと一致するかどうかを知っていますか。私たちの環境では、バックアップはI/Oのピーク時間ですが、日中にバーストが発生します。これに対する答えは、ファイルでバックアップされたディスクを使用することができるかどうか、または現在のLUNをVMに転送する必要があるかどうかを示します。
  • ネットワークスループット必要な速度を把握します。上記のように、バックアップは、NICの飽和を試み始めたときの領域です。あなたがどきどきしているデータの量を知っています。 VLANタグ付けを実行できるNICがあると確信しています。これにより、ネットワークインフラストラクチャでサポートされている場合、負荷分散の問題が緩和されます。
  • RAMクリープあなたのプログラムを知っています。与えられたメモリのすべてのビットを消費するものがあります。これにより、VMWareコンソールは、使用法について泣き言を言い、不平を言い、それをもっと与えることをお勧めします。私たちほど悲劇的な資金不足ではない場合は、ESXサーバーに大量のRAMがプロビジョニングされることを願っています。私たちの環境では、1GBを超えるRAMがneedsの場合、VMは「ピギー」であると見なします。実際のRAMは異なる場合があります。

ファイルバックアップディスクを使用できるかどうか、または直接提示されるLUNが必要かどうかを判断するには、少し知識が必要です。直接提示されたLUNは、ストレージアレイがLUNをVMに直接提示する場所です。これは、 [〜#〜] npiv [〜#〜] を使用することで簡単になります。 NPIVがなくても実行できますが、血液にとって危険すぎる可能性があります。すべての新しいファイバーチャネルハードウェアがサポートする必要があり、ESX3.5は確かにサポートします。直接提示により、ストレージアレイと仮想マシンのドキドキI/Oの間の抽象化レイヤーが削除され、その意味でパフォーマンスが向上します。ただし、直接プレゼンテーションは設定が難しく、「頭を包む」段階での起動時間が長くなります。

ファイルでバックアップされたディスクは非常に簡単です。さらに、ストレージアレイ間を非常に簡単に移動できます(マルチGBファイルのコピーが関係する特定の単純な値の場合)。これは、直接表示には(通常は非常に高価な)アレイレベルのレプリケーションソフトウェアが必要です。 I/Oの負荷が低いものは、ファイルに裏打ちされたものでうまく機能します。ファイルバックアップディスクで3000人を超えるユーザーに対してExchange2007の完全インストールを実行しています。バックアップはより高速になる可能性がありますが、日中、ユーザーは速度の低下に気づきません。

2
sysadmin1138