既存のmuninマスターにノードを追加しようとしています(セットアップしていませんが、既存の8つのノードのグラフが表示されるため、正常に機能しているようです)。問題が発生しています。これが私が従ったステップです:
マスター
ノードを/ etc/munin/munin.confに追加しました
[server.example.org]
address private.server.example.org
マスターのhtmlディレクトリは(Apache構成と一致します):
htmldir /opt/munin
そのディレクトリには、次のファイルとフォルダが含まれています。
ls -lh /opt/munin/
drwxr-xr-x 20 munin munin 4.0K 2011-11-07 16:15 example.org <= FOLDER NAMED AFTER OUR DOMAIN
-rw-r--r-- 1 munin munin 2.5K 2010-08-03 14:11 definitions.html
-rw-r--r-- 1 munin munin 3.0K 2010-08-03 14:11 favicon.ico
-rw-r--r-- 1 munin munin 15K 2011-11-07 16:21 index.html <= MAIN MUNIN PAGE
-rw-r--r-- 1 munin munin 1.8K 2010-08-03 14:11 logo-h.png
-rw-r--r-- 1 munin munin 473 2010-08-03 14:11 logo.png
-rw-r--r-- 1 munin munin 5.6K 2010-11-03 14:07 style.css
index.htmlのフッターは、このファイルがmuninによって動的に生成されることを示しているため、このファイルに触れる必要はありません。
This page was generated by <a href='http://munin-monitoring.org/'>Munin</a> version 1.4.4 at 2011-11-07 16:21:30+0000 (UTC)
ドメインディレクトリには、すべてのノードのフォルダが含まれています。私はそれが役立つことを期待して新しいノード用に1つを作成することになりましたが、違いはありませんでした
mkdir /opt/munin/example.org/server.example.org
chown munin:munin -R /opt/munin/example.org/server.example.org
Munin-cronを強制終了して再起動しましたが、違いはありません。
$ Sudo su munin munin-cron start
$ Sudo ps aux | grep munin-cron
munin 26566 0.0 0.2 4092 584 ? Ss 16:35 0:00 /bin/sh -c if [ -x /usr/bin/munin-cron ]; then /usr/bin/munin-cron; fi
munin 26567 0.0 0.2 4092 576 ? S 16:35 0:00 /bin/sh /usr/bin/munin-cron
Muninノード
インストールされたmunin-nodeパッケージ
apt-get install munin-node
/ etc/munin/munin-node.confファイルを変更して、muninマスターからのアクセスを許可する
Host *
allow ^A\.B\.C\.D$ # master IP address
port 4949
Muninノードを再起動しました
service munin-node start
新しいノードでtcpdumpを実行すると、マスターと交換されているデータが表示されるので、この時点で問題はマスターの構成にあると思います。
私が何を出しているのか、またはこれをさらにトラブルシューティングする方法についてのアイデアはありますか?
追加のトラブルシューティング
アドバイス通り、ログを確認しました
$ grep server.example.org /var/log/munin/munin-update.log
2011/11/08 08:40:03 [WARNING] Config node server.example.org listed no services for server.example.org. Please see http://munin-monitoring.org/wiki/FAQ_no_graphs for further information.
2011/11/08 09:10:02 [INFO] Reaping Munin::Master::UpdateWorker<example.org;server.example.org>. Exit value/signal: 0/0
警告により、このページに移動しました http://munin-monitoring.org/wiki/FAQ_no_graphs 。私は与えられたアドバイスに従って手順を追った。シンボリックリンクは正しく作成されているように見えましたが、問題が修正されたと思われるコマンドmunin-node-configure --Shell | sh -x
を実行しました。前述のページでは、私が行ったセットHost_name
を変更することも推奨しています(ただし、他の作業ノードには構成されていないため、役に立たないと思います)。
Telnetのトラブルシューティングは、私がそれに到達するまでに成功しました
$ telnet private.server.example.org 4949
Trying A.B.C.D...
Connected to private.server.example.org.
Escape character is '^]'.
# munin node at server.example.org
> nodes
server.example.org
.
> list server.example.org
cpu df df_inode entropy forks fw_conntrack fw_forwarded_local fw_packets if_err_eth0 if_err_eth1 if_eth0 if_eth1 interrupts iostat iostat_ios ip_A.B.C.D irqstats load memory open_files open_inodes postfix_mailqueue postfix_mailvolume proc_pri processes swap threads uptime users vmstat
> fetch df
_dev_sda1.value 23.1295909196156
_dev.value 1.2890625
_dev_shm.value 0
_var_run.value 0.00782368542525642
_var_lock.value 0
_lib_init_rw.value 0
セットアップに明らかに問題があることはわかりません。私は2つのことを提案します。
Munin-masterのログを読んでください。 _/var/log/munin/munin-update.log
_から始めます。更新が成功したことを確認するエントリがあり、rrdファイルが_/var/lib/munin/
_にある場合は、_munin-graph.log
_および_munin-html.log
_に進みます。
マスターがmunin-nodeのアドレスに接続できることを確認します。 netcat
または同様のものでテストしてください:_nc private.server.example.org 4949
_。期待される出力は次のようになります:_# munin node at hostname
_。考えられるエラーは、パケットがファイアウォールによってドロップされるか(ncはconnect()
でハングし、straceを使用すると表示されます)、または名前の解決に失敗します(netcatは_nc: getaddrinfo: Name or service not known
_を出力します)。
上記を試しても何も見つからない場合は、マスターから完全なmunin.confを貼り付けてください(数値のIPアドレスを数字で匿名化し、ホスト名を偽のテキストで匿名化します)。
それほど珍しいエラーではありません。 cronジョブは、ある時点でrootによって呼び出された可能性があります。この場合、一部のファイルはroot所有権を持ち、通常/ var/lib/munin内のすべてのファイルへの書き込みアクセスを必要とするmunin-userによって更新できません。およびhtmlディレクトリ。
ねえ、私は同じ問題を抱えていました。
ホスト上の/ etc/hostsファイルを確認し、最初のホスト名がサーバー上のmuninconfファイルで指定したものと同じであることを再確認します。
それは私たちが発見するまで私たちのセットアップを完全に破壊しました。
/ etc/Hostは次のように設定されました:1.2.3.4 hostname hostname.domain
Muninconfがhostname.domainに設定されました。サーバーは、hostname.domainではなくhostnameという名前であると考えました。