web-dev-qa-db-ja.com

誤った負荷平均をグラフ化するCacti

アップグレードが必要だと思うサーバーのCPUとメモリの使用量を監視するようにサボテンを設定しましたが、資金提供の主張をするためには、確かな事実が必要です。

Cactiにメモリ使用量と負荷平均を監視させることでうまくいくと思いましたが、生成されるグラフは現実とは何の相関関係もないようです。

トップによると、現在の私の負荷平均は約5でホバリングしていますが、サボテンは0.1でグラフ化しています!

サーバーの実際の負荷平均を監視するためにサボテンを取得するにはどうすればよいですか?監視対象のサーバーはRHEL5を実行しており、SNMPデーモンとしてnet-SNMPを使用しています。

ありがとう、

バート。

4
Bart B

Munin を確認することをお勧めします。これは、特にローカルで実行している場合は、セットアップが非常に簡単です。これにより、SNMPをいじったり、リソースデータをリモートで取得したりすることなく、CPU負荷やその他のリソースの追跡をすばやく開始できます。インストールが非常に簡単なRedHatのパッケージがあります。

1
Jason Abate

サボテンには、負荷平均から3つの値を積み重ねる悪いデフォルトグラフがあります。合計は無意味であり、それはあなたが見て騙されているものです。スタックではなく線を使用するようにデフォルトのグラフを変更すると、より良いものが表示されます。

4
labradort

@labradortの回答に追加したいと思います。

ucd/net - Load Averageテンプレートについて話していると思います。間違った値の理由は、1/5/15の平均を個別に表示し、それらを合計するためです。値は技術的には正しいですが、奇妙に見えます。これは、問題を修正する方法です。

グラフテンプレートに移動し、ucd/net - Load Averageの右側のチェックボックスを選択します。

下にスクロールし、アクションとして[複製]を選択し(削除ではありません)、[移動]をクリックします。

enter image description here

新しいテンプレートの名前を選択します(例:ucd/net - Alternative Load Average)。

引き続き[グラフテンプレート]セクションで、新しいテンプレートのハイパーリンクをクリックして編集します。

「アイテム#3」をクリックします。 「グラフアイテムタイプ」を「スタック」から「LINE1」に変更し、「保存」をクリックします。
「アイテム#5」についてこれを繰り返します。

'アイテム#7'を削除: '(タスクなし):合計'

最終的な編集は次のようになります。 enter image description here

完了したら、[保存]をクリックします。

これにより、1分間の平均が半透明のブロックになり、長い平均がきちんと遅れます。最終結果は次のようになります。 enter image description here

0