web-dev-qa-db-ja.com

誰かがデフォルトのmuninグラフの「ユースケース」を説明できますか?

Muninをインストールすると、デフォルトのプラグインセットがアクティブになります(少なくともubuntuでは)。または、munin-node-configureを実行して、システムでサポートされているプラ​​グインを確認することもできます。これらのプラグインのほとんどは、単純なデータをプロットします。私の質問はではなくデータの性質を説明することです(まあ...多分いくつかのために)がwhatこれらのグラフで探しているのはそれですか?

Muninをインストールして、派手なグラフを見るのは簡単です。しかし、グラフがあり、それらを「読み取る」ことができないと、グラフはまったく役に立たなくなります。

システムでデフォルトで有効になっている標準プラグインをリストします。したがって、それは長いリストになるでしょう。完全を期すために、私が理解できると思うプラグインをリストし、それが何に使用されていると思うかについて簡単に説明します。私がそれらのいずれかで間違っているならば、正しい嘆願。

それでは、この質問を3つの部分に分けてみましょう。

  • データすらわからないプラグイン
  • データは理解しているが、何に注意すべきかわからないプラグイン
  • 理解できると思うプラグイン

データすらわからないプラグイン

これらには、必ずしもムニンだけを対象としたものではない質問が含まれている場合があります。データを理解していないということは、通常、オペレーティングシステム/ハードウェアに関する基本的な知識のギャップを意味します。

これらは私が何が起こっているのか推測しかできないプラグインです...私はこれらの「推測」を見たくありません...

  • デバイスあたりのディスクIO(IO /秒)
    IOとは何ですか。私はそれが入出力の略であることを知っています。しかし、それはそれが行く限りです。
  • デバイスあたりのディスク遅延(平均IO待機)
    「IO待機」が何であるかについての手がかりではありません...
  • IOサービス時間
    これは非常に混乱していて、グラフに何かを表示することはほぼ不可能です。

データは理解しているが、何に注意すべきかわからないプラグイン

  • IOStat(ブロック/秒の読み取り/書き込み)
    ここで注意すべきことはスパイクだと思いますか?これは、デバイスが頻繁に使用されていることを意味しますか?
  • 利用可能なエントロピー(バイト)
    これは乱数生成にとって重要だと思いますか?なぜこれをグラフ化するのですか?これまでのところ、値は常にほぼ一定でした。
  • VMStat(実行中/ I/Oスリーププロセス)
    これと「プロセス」グラフの違いは何ですか?どちらも実行中/スリープ中のプロセスを示していますが、「プロセス」グラフには詳細があるようです。
  • デバイスあたりのディスクスループット(バイト/秒の読み取り/書き込み)
    これと「IOStat」グラフの違いは何ですか?
  • iノードテーブルの使用法
    このグラフで何を探すべきですか?

理解できると思うプラグイン

私はここでいくつかのことを推測します...私が間違っている場合は私を訂正してください。

  • ディスク使用率(パーセント(パーセント))
    使用されている/残っているディスク容量。これは100%に近づいているため、パーティションのクリーンアップまたは拡張を検討する必要があります。これは、ルートパーティションにとって非常に重要です。
  • ファイアウォールスループット(パケット/秒)
    ファイアウォールを通過するパケットの数。これが長期間スパイクしている場合は、DOS攻撃の兆候である可能性があります(または単に大きなファイルを受信して​​いるだけです)。また、ファイアウォールのパフォーマンスについてのアイデアを得ることができます。平準化していて、より多くの「電力」が必要な場合は、負荷分散を検討する必要があります。平準化してCPU負荷との相関関係が見られる場合は、ハードウェアの速度が十分でないことを意味している可能性もあります。ディスク使用量との相関関係は、FW構成内の過剰なLOGターゲットを示している可能性があります。
  • eth0エラー(パケットイン/アウト)
    ネットワークエラー。この値が増加している場合は、ハードウェアに障害がある可能性があります。
  • eth0トラフィック(ビット/秒入力/出力)
    生のネットワークトラフィック。これはファイアウォールのスループットと相関しているはずです。
  • スレッド数
    値が増え続けると、プロセスがスレッドを適切に閉じていないことを示している可能性があります。調査してください!
  • プロセス
    アクティブなプロセスの内訳(スリープを含む)。ここでの急上昇は、フォーク爆弾を指している可能性があります。ゆっくりではあるが増加し続ける値は、アプリケーションがサブプロセスを生成しているが、それらを適切に閉じていないことを示している可能性があります。 ps fauxを使用して調査します。
  • プロセス優先度
    これは、プロセスの優先順位の分布を示しています。優先度の高いプロセスしかないことはあまり役に立ちません。一部の優先順位を下げることを検討してください。
  • CPU使用率
    かなり簡単です。これが急上昇している場合は、攻撃が行われているか、プロセスがCPUを占有している可能性があります。通常の操作ではゆっくりと増加し、最大値に近づいている場合は、ハードウェアのアップグレード(または負荷分散)を検討する必要があります。
  • ファイルテーブルの使用法
    アクティブに開いているファイルの数。これが最大に達している場合は、プロセスを開いている可能性がありますが、ファイルを適切に解放していません。
  • 負荷平均
    システム負荷の要約値を表示します。 CPU使用率と相関する必要があります。値の増加は、さまざまな原因から発生する可能性があります。他のグラフとの相関関係を探します。
  • メモリ使用量
    あなたの記憶のグラフィック表現。未使用+キャッシュ+バッファがたくさんある限り、問題ありません。
  • スワップイン/スワップアウト
    スワップパーティションのアクティビティを表示します。これは常に0である必要があります。これでアクティビティが発生した場合は、マシンにメモリを追加する必要があります。
9
exhuma

デバイスあたりのディスクIO(IO /秒)

従来のハードドライブでは、これは非常に重要な数値です。 I/O操作は、ディスクへの読み取りまたは書き込み操作です。回転スピンドルを使用すると、ディスク速度とその使用パターンに応じて、1秒あたり数十からおそらく200IOPSになります。

これだけではありません。最近のオペレーティングシステムには、複数のI/O要求を1つにマージして処理を高速化しようとするI/Oスケジューラがあります。また、RAIDコントローラなどは、スマートI/O要求の並べ替えを実行します。

デバイスあたりのディスク遅延(平均IO待機)

個々のディスクに対してI/O要求を実行してから、そこから実際にデータを受信するまでにかかった時間。これが数ミリ秒前後でホバリングしている場合は問題ありません。数十ミリ秒の場合はディスクサブシステムが発汗し始めています。さらに数百ミリ秒の場合は大きな問題が発生しているか、少なくとも非常に非常に問題があります。遅いシステム。

IOサービス時間

ディスクサブシステム(おそらく多くのディスクを含む)の全体的なパフォーマンス。

IOStat(ブロック/秒の読み取り/書き込み)

1秒間に読み取られた/書き込まれたディスクブロックの数。スパイクと平均を探します。平均がディスクサブシステムの最大スループットに近づき始めたら、パフォーマンスのアップグレードを計画する時が来ました。実際には、その時点の前にそのように計画してください。

利用可能なエントロピー(バイト)

一部のアプリケーションは、「真の」ランダムデータを取得したいと考えています。カーネルは、キーボードやマウスのアクティビティ、多くのマザーボードに見られる乱数ジェネレーター、またはビデオ/音楽ファイル(video-entropydおよびaudio-entropydで実行可能)など、いくつかのソースからその「真の」ランダム性を収集します。

システムでエントロピーが不足すると、そのデータを必要とするアプリケーションは、データを取得するまで停止します。個人的には、過去にCyrusIMAPデーモンとそのPOP3サービスでこれが発生しているのを見てきました。各ログインの前に、エントロピープールを非常に迅速に消費するビジーサーバー上で、長いランダムな文字列を生成しました。

この問題を取り除く1つの方法は、セミランダムデータ(/ dev/urandom)のみを使用するようにアプリケーションを切り替えることですが、これはこのトピックには含まれていません。

VMStat(実行中/ I/Oスリーププロセス)

これまでは考えていませんでしたが、これはプロセスごとのI/O統計について、または主にI/Oを実行しているかどうか、およびそのI/OがI/Oアクティビティをブロックしているかどうかを示していると思います。そうではありません。

デバイスあたりのディスクスループット(バイト/秒の読み取り/書き込み)

これは純粋にbytes 1秒あたりの読み取り/書き込みであり、多くの場合、これはblocksよりも人間が読める形式であり、異なる場合があります。ブロックサイズは、使用するディスク、使用するファイルシステム(およびその設定)などによって異なる場合があります。ブロックサイズが512バイトの場合もあれば、4096バイトの場合もあり、それ以外の場合もあります。

iノードテーブルの使用法

動的iノード(XFSなど)を持つファイルシステムでは、何もありません。静的iノードマップ(ext3など)を持つファイルシステムでは、すべて。静的iノード、巨大なファイルシステム、膨大な数のディレクトリと小さなファイルの組み合わせがある場合、理論的には多くの空き領域が残っているにもかかわらず、そのパーティションにこれ以上ファイルを作成できない状況が発生する可能性があります。無料のiノードがない==悪い。

11