自分自身を再起動するのが好きな電源ボタンに障害のあるサーバーがあります。/var/logのacpidログファイルが約10時間ほどゴミのスパムを開始するなど、通常、警告の兆候があります。
私が何かをacpidログを監視し、新しいアクティビティがあるときに私にメールする簡単な方法はありますか?
私は自分が極端に進んだとは思わないので、このようなことを達成するための「ガイド」があれば非常に役に立ち、高く評価されます。ありがとうございました!
LogWatch のようなものを使用できます。または、次のような単純なスクリプト(環境に合わせて変更する必要がある疑似コードです):
#!/bin/bash
GREP_STRING=`grep -c <error string> <acpid log location>`
if [ $GREP_STRING -ne 0 ]
then
<send email notification>
fi
これをcronに入れて1時間おきに実行すると、異常になっていることを知らせるメールが届きます。
[〜#〜] ossec [〜#〜] HIDSを使用してログファイルのルールを設定し、同時にホストからセキュリティ情報を取得できます。
設定はとても簡単です:
/var/ossec/rules/local_rules.xml
を編集します/var/ossec/bin/ossec-control start
で起動しますlocal_rules.xml
<group name="local,syslog,">
<rule id="100001" level="13">
<regex>^.*Your string.*$</regex>
<description>I've just picked up a fault in the AE35 unit. It's going to go 100% failure in 72 hours</description>
</rule>
</group>
ルールは非常に柔軟で複雑な場合があります。ルールに関連するパラメーターの概要については、 この表 を参照してください。
他のセキュリティ機能が不要または必要ない場合は、include
タグの下のrules
行を削除して、それらの機能を無効にすることができます。
私は Nagios がネットワークで複数のマシンを監視するために作業する場所で実行することをお勧めします。その非常に良い私はあなたの仕事のためにそれを特に使用していませんが、エラーが発生したときに電子メールで送信するように設定できます。
Ubuntuにインストールするためのガイド http://beginlinux.com/blog/2008/11/install-nagios-3-on-ubuntu-810/ と、ここにインストールするためのガイドがあります- http://www.debianhelp.co.uk/nagiosinstall.htm 。
サーバーに Splunk をダウンロードしてインストールします。これはlogwatchに似ていますが、ログの検索エンジンを提供します。
ログにインデックスを付けるように構成し、ログを検索してパターンを見つけ、エラーを見つけて、その特定の障害ポイントで他のログが何を実行しているかを確認できます。
また、アラートを送信したり、特定のしきい値でスクリプトを実行したりするように設定することもできます。したがって、特定のエラーがログにスパムされ始めた場合は、それをスクリプト化して、問題のサービスを自動的に再起動できます。
私たちはサーバークラスターでsplunkを使用し、それは命の恩人です!
障害のあるサーバーをオンデマンドで再起動するために、IPMIツールで Zabbix を使用しています。また、私は [〜#〜] ossec [〜#〜] も良い選択だと思いますが、実際に試してデバッグする必要があります...
そして、あなたはこのようなものでそれを送ることができます:
EMAILMSG="/tmp/logreport.$$"
echo "Something to put in the email" >> $EMAILMSG
cat $EMAILMSG | mail -s "Whatever Subject You Like" [email protected]
rm -f $EMAILMGS
以前の雇用主では、 logsurfer + を使用してリアルタイムでログを監視し、電子メールアラートを送信していました。誤検知を調整するには多くの時間と設定が必要ですが、Nagiosが同様の目的で使用したものよりもはるかに価値のあるさまざまな調査結果とアラートに対して非常にうまく機能するルールセットがありました。
残念ながら、フィルターしたもののサンプルを提供するための構成ファイルへのアクセス権はもうありませんが、サイトはより多くの情報と例を提供するはずです。
また、私の Octopussy プロジェクトを確認することもできます。