かなり適度なサイズのvSphere「estate」があり、Windows/Linuxサーバーの80%が仮想化されており、6つのデータセンターで実行されています。私の課題の1つは、中長期のキャパシティプランニングであり、ホストのアップグレード(通常はメモリ)、より多くのホスト(ハードウェアおよびESXライセンス)、または最悪の場合のいずれかの資金を確保するために、年間の設備投資予測に十分な資金を確保しますSAN拡張。
とにかく、ごく最近まで、vCenterのパフォーマンス統計を、何が起こっているのかを真に表すものとして受け入れることに非常に満足していました。各クラスターのホストは同じように指定され、アップグレードされているなど、統計を確認するときは通常、クラスターレベルで作業します。
しかし、私は最近、私を少し悩ませている何かに気づきました。私のクラスターの1つでは、200GHzのCPU「帯域幅」を使用できます。これは次のように構成されています。
5 hosts x 2 sockets-per-Host x 6 cores-per-socket x 3.33GHz per-core = 199.8GHz
これは問題なく、vCenterはこの値を正しく報告します。ただし、vCenterでクラスターのCPU使用率を表示するか、PowerCLIの Get-Stat コマンドレットを使用して統計情報を取得すると、CPU使用率が300GHzを超える場合があります。これは、使用率の数値が150%(!)に達するため、計算を台無しにするノックオン効果があります。さて、Aレベルの計算をしてから久しぶりですが、CPUを150%活用する方法がわかりません...
そこで、VMwareサポートで通話を記録しました。そして、笑いながら、私がやろうとしていることを行うには、vCenter Operations Manager(vCOPS)を購入する必要があると言われました。まあ、ありません。正確な統計があれば、自分で意思決定支援を行うことができます(申し訳ありませんが、暴言を吐きます)。
そこで、説明を求めたところ、vCenterのデータは、平均の合計を使用した「一般的な」計算に基づいているとサポート担当者が言いました。データサンプルの平均化はごく普通のことであり、かなり受け入れられますが、100%を超える方法はまだわかりません。
それで、私はこれを自分で解決しようとしてきましたが、Xeonのハイパースレッディングまたは「ターボ」機能が結果に影響を与えているのかどうか疑問に思っています。ただし、「ターボ」の上昇は3.33GHzから3.6GHzまで、つまり8%にすぎません。
手がかりはありますか?
ここで vCenter Operations Manager が便利です。その有用性を軽視しないでください...それは潜在的にあなたよりも優れている可能性がありますDSSプラットフォーム:)ただし、ほとんどのVMware環境と同様に、RAM CPUの制限に遭遇したため、リソースが長くなりました。他の大規模なクラスターでの計画作業では、CPUが制限要因になることはなかったため、RAMとストレージのニーズに合わせてサイズを決定します。どのバージョンESXi、vSphere、およびライセンス層のいずれかがここで使用されていますか?
ホストにとっては、3.33GHz WestmereX5680ベースのシステムのように聞こえます。ハイパースレッディングをオンまたはオフにして実行するオプションがあります。ここで何か他のものが働いているようです。 CPUが150%に急上昇したとき、他のサーバーのバイタルはどのように見えますか?
利用可能なvCenterOperationsの無料利用枠があります。フル機能(60日または90日) 評価 も利用できます。これは、VMのサイズを適切に設定し、クラスターの状態を検証するために使用された場合でも、インフラストラクチャの実際のボトルネックを特定するのに非常に役立ちます。
違いを生む可能性のあるビューは、特定のリソースが使い果たされるまでの残り時間を計算する「残り時間」メトリックです。
専門用語を使用するために、私はここにまとめました。合計MHzに関しては、vCenterの数値には実際にハイパースレッディングが含まれていることがわかります。ただし、私のスプレッドシート(PowerCLIを使用して作成)は「CPUスレッドの数」を取得していなかったため、ソケット(VMware用語では「パッケージ」)とコアのみを調べていました。上記の貢献に感謝します。