私たちはNagios 3のセットアップを拡張しており、既存のインフラストラクチャをテストするために、新しいNRPEまたは一般的なNagiosプラグインに頻繁に出くわしています。ただし、これはドリブルとドラブにあります-Nagiosユーザーが最も価値のあるプラグインの概要を取得すると便利です。
投稿ごとに1つのプラグインをリストしてください。できれば、プラグインが好きな理由の簡単な説明と、MonitoringExchangeまたはプラグイン開発者サイトへのリンクを記載してください。この方法で、人々はすでにリストされているプラグインに投票でき、優先順位でそれらを見ることができます。
同じ理由で、他の人がすでに言及しているプラグインをリストしない方が良いでしょう。他の誰かがリストしたプラグインに関して追加する必要がある場合は、その回答にコメントを残してください。
ありがとう!
柔軟性の点では、snmpプラグインに勝るものはありません。私が実行するほぼすべてのチェックの背後にあり、そうでない場合、TCP接続がそうです。
私たちの最も有用なプラグインは、より高いアプリケーション機能をテストするプラグインです。たとえば、ウェブサイトにログインしようとするテストと、メールを送信し、pop3メールボックスをチェックしてメールが届いたことを確認するテストがあります。これらのいずれかが壊れた場合は、下位レベルのチェックを使用して何が問題かを確認できます。 pop3は死んでいますか? MTA、MDA?データベースサーバー?データストア?
正直なところ、私にとって最も効果的なのは、古いcheck_disk
。昨日は正常に稼働していたサーバーを爆発させ、狂ったように走り回って、ディスクをいっぱいにしてしまったので、「ペーストを食べるのをやめる」という方法で、特別な気分になるものはありません。私の人生でそれを二度とする必要がないことは、私にとって大きな価値があります。
(そして、iノードもチェックすることを忘れないでください、子供たちは家で見ています。)
WebInject は、check_http機能だけでなく、Webサイトの監視にも非常に役立ちます。ログインページを処理し、1つのNagiosチェックで複数のステップを実行できます。
check_nfsmount が私のサーバーの多くで便利だと思います。
編集:私がそれを行う担当者がいたら、check_snmpにも投票します。これは、すべてのサーバーで使用されています。また、すべてのHPプリンターで実行しているcheck_hpjdの背後にあるロジックも使用しています。
私の最も便利なのは、私が自分のWebサーバーのSSL証明書をチェックして、期限切れを監視できるように自分で書いたものです。
PNP(pnp4nagios.org)-パフォーマンスを出力するNagiosチェックのRRDスタイルのグラフを生成します。データ。特に、新しくインストールされたサービスが本当にこれらすべてのCPUスパイクの原因であることを開発者に納得させようとする場合、非常に便利です...
check_nt(件名でNSClientまたは類似のものと対話する)を使用すると、WindowsボックスでWMIに問い合わせることができます。パフォーマンスカウンターがある場合は、Nagiosで監視できます。
これは少し恥知らずなプラグインですが、NRPEを使用してWindowsマシンを監視している場合、 NagiosPluginsNT はかなりうまくいくようです。 ;-)
Check_snmpは非常に価値のあるプラグインであることに同意します。ほとんどすべての目的に使用でき、SNMPにはすべてのものが表示されます。 SNMPは、HP-UX、Tru64、OpenVMSといった多様なシステムで利用でき、追加のインストールは必要ありません。
NagiosGrapherは、非常に便利なもう1つのプラグインです(まったくそうではありません)。私は 記事 で私の経験を持っています。これは、より多くのことを説明しますが、他の人が私が経験した困難なしにそれを使用できるようにもします。
最後に:NSCA。 PerlまたはRubyまたはkshスクリプトを記述して、出力をNSCAに送ることができます。
NSCAとSNMPの柔軟性とNagiosGrapherのレポート機能を組み合わせると、監視が非常に拡大します。
Check_httpが私のウェブサイトがまだ機能していることを確認するのが好きです。ホスティング会社が空白のページを提供することを決めた後、特定のテキストがそこにあることを確認し、サーバーがまだ稼働しているのでnagiosチェックにすべて合格したことを確認しました。
私にとって最も役立つのは、私のニーズに合わせて書いたものです。 nagios-check-webpage
実際のナビゲーターのように、js/css/imagesとマルチスレッドとgzip(多くの帯域幅を節約)を使用してページ全体をダウンロードします。
まあ、シンプルでプレーンなデフォルトのもの-check_disk、check_load、check_httpは、ほとんどの場合に十分です(ほとんどの場合、サーバー、Webサイトが稼働しているかどうかを知りたいと思います)。
また、check_diskとcheck_swap以外に、check_memory http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/check_memory/details があり、メモリの使用量を増やします。 。
最も重要なプラグインの1つは、私が自分で作成したプラグイン、check_rdiff_backupです。私は海外でバックアップを行っており、Nagiosは何かが発生したかどうか、いつ発生したかを教えてくれます。
Rdiff-backupプラグインを探している場合は、Googleで見つけることができます。
厳密にはプラグインではありませんが、アラートをオフにする手段として機能するtwurl( https://github.com/marcel/twurl )を取得することは絶対的な天の恵みでした。 SMSアラートの必要はなく、すべてのラウンドを満たします。
方法の詳細: Twitterを使用したNagiosアラート(twurlを使用)が起動しない -恥知らずな自己宣伝の謝罪;)
他のもの...
Check_diskio( https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio )は、標準のCPU負荷およびプロセス番号チェックと組み合わせて、いつ/ if =を判断するのに非常に役立ちましたIOバインドされ、どのように。nagiosgraphを使用する( http://exchange.nagios.org/directory/Addons/Graphing-and-Trending/nagiosgraph/details )はそれをさらに簡単にします。
私にとってのcheck_curlは天の恵みです。本当にWebサイトのチェックを行うことで柔軟性に違いがあり、また、私が必要とするほぼすべての機能を備えているため、webinjectよりもはるかに簡単であることがわかりました
1つ目は NagiosWSC WMIを介したWindowsホストの監視エージェントレスです。
Webサイトをプルアップする実際のレイテンシをチェックし、「status:ok」非表示タグをスキャンします。それは私たちのイカキャッシュと言語セットの問題をキャッチしました。言語セットの問題は、ページのトルコ語の国際化バージョンを要求するブラウザーで誰かがサイトにアクセスしたときに、毎晩午前3時に1回だけ発生しました。
真剣に、可能なすべてのタイプのモニタリングをセットアップします。複雑な環境で適切な監視を使用して検出できる奇妙なバグとエラーは、驚くべきものです。また、パフォーマンスデータをRRDデータベースに記録し、Cactiで表示します。
Centreonは明確にグラフとすべてのNagios機能を提供します!
check_aptは本当にクールで、Debianサーバーの更新について思い出させてくれます。
check_nrpeで使用されるcheck_multiprocs リンクテキスト
私は多くの開発を行ったため、これは一種の不正行為であり、実際にはさまざまなことを一度にチェックしますが、私にとって最も有用なnagios 'プラグイン'は Resmon です。これはサーバー自体で実行するエージェントであり、nagiosはhttp経由で接続してチェックを実行します。それはnrpeが行うことと似ていますが、多くの異なる設計上の決定があります。
最近、私は check_multi プラグインの使用を開始しました。パッチを適用した/ enhanced NRPE を使用して(HTMLとパフォーマンス情報のため)大規模な出力を行います。
ほぼ「すべてを統治する1つのプラグイン」です! ;-)
私は2つのプラグインを使用しました。1つはアラートのXMLフィードを提供することで、もう1つはTwitter経由でアラートを送信することでした。どちらも便利でした(通常のプラグインは別として)。 NRPEをプラグインとしてカウントする場合は、それも追加します。