Puppetを使用してSensuとUchiwaを構成しました。クライアントが報告し、チェックが失敗したときにイベントを発生させています。
Puppetによって作成されたサーバーの/etc/sensu/conf.d/checks/
フォルダーに、pingチェックなどのチェックがあります。例:
{
"checks": {
"check-ping-controller.local.net": {
"subscribers": [ "sensu" ],
"standalone": false,
"interval": 60,
"handlers": [ "default" ],
"command": "/usr/lib64/nagios/plugins/check_ping -H 192.168.66.125 -w 100.0,60% -c 200.0,90% "
}
}
}
うちわの「クライアント」ページでサーバーを見ると(サーバーは自分自身を監視するためにsensu-clientも実行しているため)、そこにチェックがリストされているのがわかります。ただし、実際の「チェック」ページには何も表示されません。データセンター全体で何が実行されているかを確認できれば便利です。
誰かがこれに精通していて、私が直面している可能性のある問題を知っていますか? Centos6.5でUchiwa0.4とSensu0.16を実行しています。
更新:過去20分間に、redisで「flushall」を実行し、Sensuサービスの更新を引き起こすノード(プロビジョニング解除されたノード)にいくつかの変更を加えました。これで問題が修正されたようで、チェックが表示されています。それはredisの「flushall」コマンドだったと思いますが、私はRedisに精通しておらず、なぜそれが役立つのかわかりません...
SFのアイデアはありますか?
私にとっての解決策は、sensu-apiサービスを再起動することでした。
これを行うと、パブリッシュ/サブスクライブチェックが[チェック]画面のうちわダッシュボードに表示されました。 CentOS7.2でSensu0.21、Uchiwa0.14.1を使用しています。私は管理者ですなぜsensu-apiサービスの再起動が必要なのかわかりません。
Sensu-serverサービスを個別に再起動してredisdbをフラッシュしてみましたが、どちらもうちわダッシュボードには影響しませんでした。