web-dev-qa-db-ja.com

コンピューターのグリッドを監視する最良の方法は?

Sun GridEngineを10ノードと1つの仮想マスターホストにインストールしました。

現在、本番環境にリリースする前にすべてのリソースを監視する必要がありますが、どちらが最善の方法かわかりません。 xml-qstatを使用してみましたが、不安定なようです。

ヒントや提案はありますか?

誰もがこれを経験しましたか?

ありがとう。

2
Marc Riera

Ganglia を使用できます。 Holland Computing Center で数千のノードを持つGangliaを使用しており、特に履歴グラフを探している場合は、ほとんどの場合、かなりうまく機能しているようです。 Nagiosはアクティブな監視に使用されます。

4
ryanlim

念のために言っておきますが、Munin( http://munin-monitoring.org/ )もとても素敵です。

1
markusN

私があなたを正しく理解しているなら、あなたはグリッドサーバーの束を監視する必要があります。どんなモニタリングを考えていますか?おそらく Nagios のようなものにいくつかの追加のスクリプトを追加すると、ニーズに合う可能性がありますか?

例があります ここに

1
solefald

稼働時間や可用性よりも指標に関心があるようです。 Circonus( http://circonus.com/ )はここにぴったりです。 Resmon XML DTDを介してインポートできる、事実上すべてのメトリックを相互に関連付けることができます。

0
obfuscurity