web-dev-qa-db-ja.com

LogstashForwarderがCentOS5のchkconfigで起動しない

このRPMからインストールするCentOS5マシンにlogstash-forwarderをセットアップしました。

http://download.elasticsearch.org/logstash-forwarder/packages/logstash-forwarder-0.3.1-1.x86_64.rpm

プロセスを実行したところ、CentOS/RHEL/Fedora用に提供されたinitスクリプトが期待どおりに機能しないことがわかりました。コマンドを実行しても情報がフィードバックされず、プロセスが開始されませんでした。他の誰かが同様の問題を抱えていて、 自分で書いたこのスクリプトは、serviceまたはinit.dコマンドを使用してlogstash-forwarderを起動すると正常に機能することがわかりました。ただし、サーバーを再起動するとサービスが起動しないことに気付きました(以下は再起動直後のものです)。

# service logstash-forwarder status
logstash-forwarder dead but pid file exists

# chkconfig --list logstash-forwarder
logstash-forwarder      0:off   1:off   2:off   3:on    4:on    5:on    6:off

その後、手動で起動すると、すべて正常に動作します。いくつかの調査によると、ここにファイルが必要であると言われています(ランレベル3を使用しているため)。

# ls -la /etc/rc3.d/ | grep logstash
lrwxrwxrwx  1 root root   28 Nov  5 12:33 S99logstash-forwarder -> ../init.d/logstash-forwarder

これは適切であり、数値リストではsmartdが後に続くだけなので、logstash-forwarderが依存するサービスがまだ起動されていないという問題はないと思います。なぜこれが起動しないのかをさらに調査する方法を誰かにアドバイスできますか?

編集

この問題はCentOS6システムでは明らかではなく、CentOS5マシンでのみ発生することに気づきました。 initスクリプトテンプレートファイルは基本的に同じであるため、これによってどのような違いが生じるかはわかりません。誰でも?

さらに編集

Initスクリプトを少し変更する必要がありました。これは、/ var/log/messagesをlogstashサーバーに送信していたためですが、initスクリプトを使用すると、logstashログがメッセージに送られ、フィードバックループが発生します。ログをlogstashに送信すると、メッセージにログが追加され、メッセージがlogstashに送信されます。そこで、initスクリプトを少し変更しました。

#! /bin/sh
#
# chkconfig: 345 99 99
# description: logstash-forwarder
# processname: logstash-forwarder
# config: /etc/logstash-forwarder

# Source function library.
. /etc/init.d/functions

NAME=logstash-forwarder
DESC="log shipper"
PATH=/sbin:/usr/sbin:/bin:/usr/bin
PIDFILE=/var/run/$NAME.pid
SCRIPTNAME=/etc/init.d/$NAME
DAEMON=/opt/logstash-forwarder/bin/logstash-forwarder
DAEMON_ARGS="-config /etc/logstash-forwarder/logstash-forwarder.conf -spool-size 100"

start() {
        echo -n "Starting $NAME: "
        daemon --pidfile $PIDFILE "Nohup $DAEMON $DAEMON_ARGS >/dev/null 2>&1 &"
        touch /var/lock/subsys/$NAME
        echo $(pidofproc $NAME) > $PIDFILE
        echo
        return 0
}

stop() {
        echo -n "Shutting down $NAME: "
        killproc -p $PIDFILE
        rm -f /var/lock/subsys/$NAME
        echo
        return 0
}

case "$1" in
    start)
        start
        ;;
    stop)
        stop
        ;;
    status)
        status -p $PIDFILE $NAME
        ;;
    restart)
        stop
        start
        ;;
    *)
        echo "Usage: service $NAME {start|stop|status|restart}"
        exit 1
        ;;
esac
exit $?

このスクリプトはCentOS6で完全に機能しますが、CentOS 5で再起動すると、上記で説明した問題が発生します。助けていただければ幸いです。

別の編集

さらにテストを行ったところ、マシンを再起動するとlogstash-forwarderが起動しますが、logstash-forwarder.pidファイルが空であるため、プロセスが見つからないという理由だけでinitスクリプトが停止していると言っていると思います。 pidファイルに記載されていないため。以下は、再起動直後のものです。

# service logstash-forwarder status
logstash-forwarder dead but pid file exists
# ps -ef | grep logstash
root      3297     1  2 10:20 ?        00:00:02 /opt/logstash-forwarder/bin/logstash-forwarder -config /etc/logstash-forwarder/logstash-forwarder.conf -spool-size 100 -log-to-syslog
root      3722  3324  0 10:22 pts/0    00:00:00 grep logstash
# cat /var/run/logstash-forwarder.pid

# service logstash-forwarder restart
Shutting down logstash-forwarder:                          [FAILED]
Starting logstash-forwarder:                               [  OK  ]
# cat /var/run/logstash-forwarder.pid
3748 3297
# ps -ef | grep logstash
root      3297     1  2 10:20 ?        00:00:03 /opt/logstash-forwarder/bin/logstash-forwarder -config /etc/logstash-forwarder/logstash-forwarder.conf -spool-size 100 -log-to-syslog
root      3748     1  1 10:22 pts/0    00:00:00 /opt/logstash-forwarder/bin/logstash-forwarder -config /etc/logstash-forwarder/logstash-forwarder.conf -spool-size 100 -log-to-syslog
root      3767  3324  0 10:22 pts/0    00:00:00 grep logstash
# service logstash-forwarder restart
Shutting down logstash-forwarder:                          [  OK  ]
Starting logstash-forwarder:                               [  OK  ]
# ps -ef | grep logstash
root      3788     1  5 10:22 pts/0    00:00:00 /opt/logstash-forwarder/bin/logstash-forwarder -config /etc/logstash-forwarder/logstash-forwarder.conf -spool-size 100 -log-to-syslog
root      3796  3324  0 10:22 pts/0    00:00:00 grep logstash
# cat /var/run/logstash-forwarder.pid
3788

したがって、サービスが開始され、pidファイルにエントリが作成されないように見えます。プロセスを再起動すると、最初のプロセスが強制終了されないため、サービスのコピーが2つ実行されますが、2回目に再起動すると、両方のプロセスが強制終了されます。そして、私は1つのプロセスを持つことに戻りました。

次に、マシンを起動したときにpidファイルエントリが変更されない理由を理解する必要があります。

3
Rumbles

プロジェクトの github page に問題について投稿することになり、 別の問題 を指す非常に迅速な応答がありました。これには別のinitスクリプトが付属しています。これで実装しました。これは正しく機能しているようです。

CentOS IRCチャネルの支援のためのTrevorHと、新しいinitスクリプトにアクセスしてくれたgithubの driskell のおかげで、以下にコピーします。上記のスクリプトで私が抱えているのと同じ問題を誰かが抱えている場合の参照:

#!/bin/bash
# chkconfig: 345 80 20
# description: Logstash Forwarder
# processname: logstash-forwarder
# config: /etc/logstash-forwarder
# pidfile: /var/run/logstash-forwarder.pid

### BEGIN INIT INFO
# Provides: logstash-forwarder
# Required-Start: $local_fs $network $remote_fs
# Required-Stop: $local_fs $network $remote_fs
# Default-Start: 2 3 4 5
# Default-Stop: 0 1 6
# Short-Description: start and stop logstash-forwarder
# Description: Logstash Forwarder
### END INIT INFO

# Source function library.
. /etc/rc.d/init.d/functions

PATH=/sbin:/usr/sbin:/bin:/usr/bin

prog=logstash-forwarder
DAEMON=/opt/logstash-forwarder/bin/logstash-forwarder
pidfile=/var/run/$prog.pid
lockfile=/var/lock/subsys/$prog

# load defaults

[ -e /etc/default/$prog ] && . /etc/default/$prog
[ -e /etc/sysconfig/$prog ] && . /etc/sysconfig/$prog

DAEMON_ARGS="${DAEMON_ARGS:--config /etc/logstash-forwarder -spool-size 100 -log-to-syslog}"

start()
{
    echo -n $"Starting $prog: "
    Nohup $DAEMON $DAEMON_ARGS </dev/null >/dev/null 2>&1 &
    retval=$?
    pid=$!
    echo $pid > $pidfile
    if [ rh_status_q ]; then
        touch $lockfile
        success
        echo
    fi
    return $retval
}

stop()
{
    echo -n $"Stopping $prog: "
    killproc -p "$pidfile" $prog
    retval=$?
    [ -f "$pidfile" ] && rm -f $pidfile
    echo
    [ $retval -eq 0 ] && rm -f $lockfile
    return $retval
}

restart() {
    stop
    start
}

reload() {
    restart
}

force_reload() {
    restart
}

rh_status() {
    status -p $pidfile $prog
}

rh_status_q() {
    rh_status >/dev/null 2>&1
}

case "$1" in
    start)
        rh_status_q && exit 0
        $1
        ;;
    stop)
        rh_status_q || exit 0
        $1
        ;;
    restart)
        $1
        ;;
    reload)
        rh_status_q || exit 7
        $1
        ;;
    force-reload)
        force_reload
        ;;
    condrestart|try-restart)
        rh_status_q || exit 0
        restart
        ;;
    status)
        rh_status
        ;;
    *)
        echo "Usage: $0 {start|stop|status|restart|condrestart|try-restart|reload|force-reload}"
        exit 2
esac
exit $?

元のスクリプトのDAEMON_ARGSステートメントに.confが含まれていたため、これはわずかに変更されましたが、CentOS5または6では必要ありませんでした。

編集

Initスクリプトにいくつかの問題がありましたが、コミッターが今日それを更新しました。私のインスタンスでは、次のファイルのいずれかも必要でした。

/etc/defaults/logstash-forwarder
/etc/sysconfig/logstash-forwarder

コンテンツ:

DAEMON_ARGS="${DAEMON_ARGS:--config /etc/logstash-forwarder/logstash-forwarder.conf -spool-size 100}" 
2
Rumbles

Logstash-forwarderがシャットダウンプロセス中に適切に停止/強制終了されていないようです。

Initスクリプトを使用してlogstash-forwarderを手動で試し、デーモンが完全に停止するまでに実際にかかる時間を確認しましたか? logstash-forwarderがCentOS5マシンで追跡しているログは、CentOS 6マシンが追跡しているものと比較して大きなログファイルですか?

最後の手段として、SIGKILLをkillprocに渡して、再起動前にlogstash-forwarderが確実に停止するようにすることができます。

killproc -p $PIDFILE -9
1
Alpha01