web-dev-qa-db-ja.com

Nagios CHECK_NRPE:デーモンからのデータの受信中にエラーが発生しました。 RHEL 6

そこで、RedHatサーバーでNagioscheck_loadサービスをセットアップしようとしています。 Red Hatのドキュメントに従ってNRPEクライアントをインストールしました: https://access.redhat.com/documentation/en-US/Red_Hat_Enterprise_Linux_OpenStack_Platform/3/html/Installation_and_Configuration_Guide/Installing_and_Configure_NRPE.html

Nagios GUIで、私はこれを取得します:

CHECK_NRPE: Error receiving data from daemon.

しかし、デバッグするためにNagiosサーバーにログインすると、ターミナルからこれを正常に実行できるように見えます。

root@portalmon:/Nagios# /usr/local/nagios/libexec/check_nrpe -H 10.0.XX.XXX -c check_load -t 30
OK - load average: 0.15, 0.10, 0.04|load1=0.150;15.000;30.000;0; load5=0.100;10.000;25.000;0; load15=0.040;5.000;20.000;0;

ですから、それは許可の問題ではないと思います。ある種のパスの問題だと思いますが、なぜこれが機能しないのか理解できません。誰か助けてもらえますか?

これが私のサービスの説明です:

define service{
  use                 dev-service
  Host_name           [DEV] Luminis Admin DEV Portal
  service_description CPU-Load
  check_command       check_nrpe!"check_load"
}

上記のターミナルコマンドを実行したときに、同じサービスを呼び出しているのではないかと思います。

[〜#〜]編集[〜#〜]:問題を理解しました。現在、解決に取り組んでいます。 Nagiosをデバッグモードに変更し、/ usr/local/nagios/var/nagios.debugを見ると、実行されているコマンドが

/usr/local/nagios/libexec/check_nrpe -n -t 60 -H <hostname> -c check_load

の代わりに

/usr/local/nagios/libexec/check_nrpe -H 10.0.XX.XXX -c check_load -t 30

したがって、何かが「-n」を追加していて、それが問題を引き起こしています。 2番目のコマンドは必要なものを返しますが、最初のコマンドは

CHECK_NRPE: Error receiving data from daemon.

編集2:それを理解しましたが、有効な回答として提出するのに十分な評判がないので、以下に入力しました。

問題を解決することができました。これが私がしたことです。

  1. Nagios.cfgで、デバッグモードをオンにして、デバッグファイルの場所を見つけました。
  2. デバッグログを追跡しながら問題を再現しました。 Nagiosが実行していたコマンドが、私が期待していたものとは異なることがわかりました。 No SSLフラグ(-n)を追加していました。
  3. コマンド.cfgで、check_nrpeを検索しました。 -nを指定してコマンドを実行していることがわかりました。 -nフラグなしでcheck_nrpeを実行するcheck_secure_nrpeという別のコマンドがありました。
  4. Check_nrpeの代わりにcheck_secure_nrpeを使用するようにサービスの説明を編集しました。
  5. Nagiosを再起動しました。

これで、サービスは期待どおりに機能します。

1
RommelTJ

問題を解決することができました。これが私がしたことです。

  1. Nagios.cfgで、デバッグモードをオンにして、デバッグファイルの場所を見つけました。
  2. デバッグログを追跡しながら問題を再現しました。 Nagiosが実行していたコマンドが私が期待していたものと異なっていることがわかりました。 No SSLフラグ(-n)を追加していました。
  3. コマンド.cfgで、check_nrpeを検索しました。 -nを指定してコマンドを実行していることがわかりました。 -nフラグなしでcheck_nrpeを実行するcheck_secure_nrpeという別のコマンドがありました。
  4. Check_nrpeの代わりにcheck_secure_nrpeを使用するようにサービスの説明を編集しました。
  5. Nagiosを再起動しました。

これで、サービスは期待どおりに機能します。

2
RommelTJ

あなたの答えは大いに役立ちます、ありがとう。

別の解決策があります。 objects/commands.cfgを編集し、-nコマンドからcheck_nrpeを削除できます。

このようにして、check_nrpeの代わりにcheck_secure_nrpeを引き続き使用できます。

0
ekiyanov