web-dev-qa-db-ja.com

Dockerコンテナで1つのサービスがクラッシュした後、Supervisordが終了しない

次の監視対象構成があります。

[supervisord]
nodaemon=true
logfile=NONE

[program:service1]
command=/usr/sbin/service1
user=someone
autostart=true
autorestart=true
startsecs=30

[program:service2]
command=/usr/sbin/service2
user=root
autostart=true
autorestart=true
startsecs=30

Dockerコンテナーでこの構成を使用しています。問題は、service1がクラッシュしても、コンテナはすべてが正常であるかのように実行され続けることです。 1つのサービスがクラッシュした場合にコンテナ全体が終了するように、この動作を変更するにはどうすればよいですか?

2
manifestor

このSFQ&Aのタイトル: 結果が0で終了した場合にすべてのスーパーバイザープロセスを終了する方法 あなたが探しているもののように聞こえます。

注:このアプローチでは、 eventlistener を使用します。

例1

[supervisord]
nodaemon=true
logfile=NONE

[program:service1]
command=/usr/sbin/service1
user=someone
autostart=true
;autorestart=true               ; disabled
;startsecs=30                   ; disabled
process_name=service1

[program:service2]
command=/usr/sbin/service2
user=root
autostart=true
;autorestart=true               ; disabled
;startsecs=30                   ; disabled
process_name=service2

[eventlistener:service1_exit]
command=kill.py
process_name=service1
events=PROCESS_STATE_EXITED

[eventlistener:service2_exit]
command=kill.py
process_name=service2
events=PROCESS_STATE_EXITED

kill.py 脚本:

$ cat kill.py
#!/usr/bin/env python
import sys
import os
import signal

def write_stdout(s):
   sys.stdout.write(s)
   sys.stdout.flush()
def write_stderr(s):
   sys.stderr.write(s)
   sys.stderr.flush()
def main():
   while 1:
       write_stdout('READY\n')
       line = sys.stdin.readline()
       write_stdout('This line kills supervisor: ' + line);
       try:
               pidfile = open('/var/run/supervisord.pid','r')
               pid = int(pidfile.readline());
               os.kill(pid, signal.SIGQUIT)
       except Exception as e:
               write_stdout('Could not kill supervisor: ' + e.strerror + '\n')
       write_stdout('RESULT 2\nOK')
if __name__ == '__main__':
   main()
   import sys
main issue I forgot to point to **process_name**

例2

この例は、より合理化されたアプローチを示しています。引き続きeventlistenerを使用していますが、上記と同じ方法を示していますが、代わりに単一のリスナーとシェルスクリプトを使用しています。

殺害を行うシェルスクリプト:

$ cat stop-supervisor.sh
#!/bin/bash

printf "READY\n";

while read line; do
  echo "Processing Event: $line" >&2;
  kill -3 $(cat "/var/run/supervisord.pid")
done < /dev/stdin

Supervisord.conf:

$ cat supervisord.conf
[supervisord]
nodaemon=true
loglevel=debug
logfile=/var/log/supervisor/supervisord.log
pidfile=/var/run/supervisord.pid
childlogdir=/var/log/supervisor

[program:service1]
command=/usr/sbin/service1
user=someone
autostart=true
;autorestart=true               ; disabled
;startsecs=30                   ; disabled
process_name=service1

[program:service2]
command=/usr/sbin/service2
user=root
autostart=true
;autorestart=true               ; disabled
;startsecs=30                   ; disabled
process_name=service2

[eventlistener:processes]
command=stop-supervisor.sh
events=PROCESS_STATE_STOPPED, PROCESS_STATE_EXITED, PROCESS_STATE_FATAL

参考文献

1
slm