web-dev-qa-db-ja.com

bashスクリプトから複数のプログラムを並列に実行する方法

私は。shファイル多くのプログラムを走らせることを試みています同時に

私はこれを試しました

prog1 
prog2

しかし、これはprog1を実行し、prog1が終了してprog2を開始するまで待機します。

それではどうやってそれらを並列に実行することができますか?

192
Betamoo
prog1 &
prog2 &
170
psmears

どうですか?

prog1 & prog2 && fg

この意志:

  1. prog1を起動します。
  2. それをバックグラウンドに送るが、その出力を印刷し続ける。
  3. prog2を起動し、フォアグラウンドで保持なので、ctrl-cで閉じることができます。
  4. prog2を閉じると、prog1foregroundに戻るので、ctrl-cを使って閉じることもできます。
256
Ory Band

GNU Parallel http://www.gnu.org/software/parallel/ と同じくらい簡単です:

(echo prog1; echo prog2) | parallel

またはあなたが好めば:

parallel ::: prog1 prog2

もっと詳しく知る:

57
Ole Tange

waitを使用できます。

some_command &
P1=$!
other_command &
P2=$!
wait $P1 $P2

バックグラウンドプログラムのPIDを変数に割り当て($!は最後に起動したプロセスのPID)、次にwaitコマンドはそれらを待ちます。スクリプトを終了するとプロセスも終了するため、これはいい方法です。

51
trusktr

ctrl-cで複数のプロセスを簡単に実行して強制終了できるようにしたい場合、これが私のお気に入りの方法です。複数のバックグラウンドプロセスを(…)サブシェルで生成し、SIGINTname__をトラップしてkill 0を実行します。

(trap 'kill 0' SIGINT; prog1 & prog2 & prog3)

複雑なプロセス実行構造を持つことができ、すべてが単一のctrl-cで終了します(最後のプロセスがフォアグラウンドで実行されることを確認してください。つまり、&の後にprog1.3を含めないでください)。

(trap 'kill 0' SIGINT; prog1.1 && prog1.2 & (prog2.1 | prog2.2 || prog2.3) & prog1.3)
21
Quinn Comendant
#!/bin/bash
prog1 & 2> .errorprog1.log; prog2 & 2> .errorprog2.log

エラーを別々のログにリダイレクトします。

9
fermin

Nohupを呼び出す非常に便利なプログラムがあります。

     Nohup - run a command immune to hangups, with output to a non-tty
8
3h4x

これは、max nプロセスで並列に実行するために使用する関数です(この例ではn = 4)。

max_children=4

function parallel {
  local time1=$(date +"%H:%M:%S")
  local time2=""

  # for the sake of the example, I'm using $2 as a description, you may be interested in other description
  echo "starting $2 ($time1)..."
  "$@" && time2=$(date +"%H:%M:%S") && echo "finishing $2 ($time1 -- $time2)..." &

  local my_pid=$$
  local children=$(ps -eo ppid | grep -w $my_pid | wc -w)
  children=$((children-1))
  if [[ $children -ge $max_children ]]; then
    wait -n
  fi
}

parallel sleep 5
parallel sleep 6
parallel sleep 7
parallel sleep 8
parallel sleep 9
wait

Max_childrenがコアの数に設定されている場合、この関数はアイドル状態のコアを回避しようとします。

7
arnaldocan

あなたは ppss を試すことができます。 ppssはかなり強力です - あなたもミニクラスタを作成することができます。 xargs -Pは、厄介なほどに並列処理を行うバッチがある場合にも役立ちます。

7
ljt

xargs -P <n>を使用すると、<n>コマンドを並行して実行できます。

-Pは非標準オプションですが、GNU(Linux)およびmacOS/BSD実装の両方でサポートされています。

次の例:

  • 最大で 3つのコマンドを同時に並行して実行します。
  • 以前に起動したプロセスが終了したときにのみ開始される追加のコマンド。
time xargs -P 3 -I {} sh -c 'eval "$1"' - {} <<'EOF'
sleep 1; echo 1
sleep 2; echo 2
sleep 3; echo 3
echo 4
EOF

出力は次のようになります。

1   # output from 1st command 
4   # output from *last* command, which started as soon as the count dropped below 3
2   # output from 2nd command
3   # output from 3rd command

real    0m3.012s
user    0m0.011s
sys 0m0.008s

タイミングは、コマンドが並行して実行されたことを示しています(最後のコマンドは、最初の3つのうちの最初のコマンドが終了した後にのみ起動されましたが、非常に迅速に実行されました)。

xargsコマンド自体は、すべてのコマンドが終了するまで戻りませんが、制御演算子&で終了してからwaitビルトインを使用してxargsコマンド全体が終了するまで待機することで、バックグラウンドで実行できます。

{
  xargs -P 3 -I {} sh -c 'eval "$1"' - {} <<'EOF'
sleep 1; echo 1
sleep 2; echo 2
sleep 3; echo 3
echo 4
EOF
} &

# Script execution continues here while `xargs` is running 
# in the background.
echo "Waiting for commands to finish..."

# Wait for `xargs` to finish, via special variable $!, which contains
# the PID of the most recently started background process.
wait $!

注意:

  • BSD/macOS xargsでは、並行して実行するコマンドの数を指定する必要がありますexplicitly、一方、GNU xargsでは、-P 0を指定して、できるだけ多く実行するできるだけ並行して。

  • 並行して実行されるプロセスからの出力は生成中に到着するため、予測不能なインターリーブになります。

    • GNU parallelOleの答え (ほとんどのプラットフォームでnotが標準になります)、便利なserializes(グループ化)プロセスベースで、より多くの高度な機能を提供します。
7
mklement0

私は最近複数のプログラムを同時に実行し、それらの出力を別々のログファイルにリダイレクトし、それらが終了するのを待つ必要があるという同様の状況を経験しました。

#!/bin/bash

# Add the full path processes to run to the array
PROCESSES_TO_RUN=("/home/joao/Code/test/prog_1/prog1" \
                  "/home/joao/Code/test/prog_2/prog2")
# You can keep adding processes to the array...

for i in ${PROCESSES_TO_RUN[@]}; do
    ${i%/*}/./${i##*/} > ${i}.log 2>&1 &
    # ${i%/*} -> Get folder name until the /
    # ${i##*/} -> Get the filename after the /
done

# Wait for the processes to finish
wait

ソース: http://joaoperibeiro.com/execute-multiple-programs-and-redirect-their-outputs-linux/

6
Joaopcribeiro

プロセス生成マネージャ

確かに、厳密に言えばこれらはプロセスであり、このプログラムは実際にはプロセス生成マネージャと呼ばれるべきですが、これはBASHがアンパサンドを使用してフォークするときに機能する方法によるものです。これは、メモリを共有するpthread_create()のようなものではなく、別のメモリスペースにクローンを作成します。 BASHが後者をサポートしていれば、それぞれの「実行シーケンス」はまったく同じように動作し、より効率的なメモリフットプリントを得ながら伝統的なスレッドと言えるでしょう。しかし、機能的には同じように機能しますが、GLOBAL変数は各ワーカークローンで使用できないため、少し難しいですが、重要なセクションを管理するためのプロセス間通信ファイルと初歩的な群れセマフォを使用します。もちろんBASHからフォークすることがここでの基本的な答えですが、私は人々がそれを知っているかのように感じますが、本当にそれをフォークして忘れるよりはむしろ生み出されるものを管理しようとしています。これは、すべて単一のリソースにアクセスする分岐プロセスの最大200インスタンスを管理する方法を示しています。明らかにこれはやり過ぎですが、私はそれを書くことを楽しんだので続けました。それに応じて端末のサイズを大きくしてください。これが役に立つことを願っています。

ME=$(basename $0)
IPC="/tmp/$ME.ipc"      #interprocess communication file (global thread accounting stats)
DBG=/tmp/$ME.log
echo 0 > $IPC           #initalize counter
F1=thread
SPAWNED=0
COMPLETE=0
SPAWN=1000              #number of jobs to process
SPEEDFACTOR=1           #dynamically compensates for execution time
THREADLIMIT=50          #maximum concurrent threads
TPS=1                   #threads per second delay
THREADCOUNT=0           #number of running threads
SCALE="scale=5"         #controls bc's precision
START=$(date +%s)       #whence we began
MAXTHREADDUR=6         #maximum thread life span - demo mode

LOWER=$[$THREADLIMIT*100*90/10000]   #90% worker utilization threshold
UPPER=$[$THREADLIMIT*100*95/10000]   #95% worker utilization threshold
DELTA=10                             #initial percent speed change

threadspeed()        #dynamically adjust spawn rate based on worker utilization
{
   #vaguely assumes thread execution average will be consistent
   THREADCOUNT=$(threadcount)
   if [ $THREADCOUNT -ge $LOWER ] && [ $THREADCOUNT -le $UPPER ] ;then
      echo SPEED HOLD >> $DBG
      return
   Elif [ $THREADCOUNT -lt $LOWER ] ;then
      #if maxthread is free speed up
      SPEEDFACTOR=$(echo "$SCALE;$SPEEDFACTOR*(1-($DELTA/100))"|bc)
      echo SPEED UP $DELTA%>> $DBG
   Elif [ $THREADCOUNT -gt $UPPER ];then
      #if maxthread is active then slow down
      SPEEDFACTOR=$(echo "$SCALE;$SPEEDFACTOR*(1+($DELTA/100))"|bc)
      DELTA=1                            #begin fine grain control
      echo SLOW DOWN $DELTA%>> $DBG
   fi

   echo SPEEDFACTOR $SPEEDFACTOR >> $DBG

   #average thread duration   (total elapsed time / number of threads completed)
   #if threads completed is zero (less than 100), default to maxdelay/2  maxthreads

   COMPLETE=$(cat $IPC)

   if [ -z $COMPLETE ];then
      echo BAD IPC READ ============================================== >> $DBG
      return
   fi

   #echo Threads COMPLETE $COMPLETE >> $DBG
   if [ $COMPLETE -lt 100 ];then
      AVGTHREAD=$(echo "$SCALE;$MAXTHREADDUR/2"|bc)
   else
      ELAPSED=$[$(date +%s)-$START]
      #echo Elapsed Time $ELAPSED >> $DBG
      AVGTHREAD=$(echo "$SCALE;$ELAPSED/$COMPLETE*$THREADLIMIT"|bc)
   fi
   echo AVGTHREAD Duration is $AVGTHREAD >> $DBG

   #calculate timing to achieve spawning each workers fast enough
   # to utilize threadlimit - average time it takes to complete one thread / max number of threads
   TPS=$(echo "$SCALE;($AVGTHREAD/$THREADLIMIT)*$SPEEDFACTOR"|bc)
   #TPS=$(echo "$SCALE;$AVGTHREAD/$THREADLIMIT"|bc)  # maintains pretty good
   #echo TPS $TPS >> $DBG

}
function plot()
{
   echo -en \\033[${2}\;${1}H

   if [ -n "$3" ];then
         if [[ $4 = "good" ]];then
            echo -en "\\033[1;32m"
         Elif [[ $4 = "warn" ]];then
            echo -en "\\033[1;33m"
         Elif [[ $4 = "fail" ]];then
            echo -en "\\033[1;31m"
         Elif [[ $4 = "crit" ]];then
            echo -en "\\033[1;31;4m"
         fi
   fi
      echo -n "$3"
      echo -en "\\033[0;39m"
}

trackthread()   #displays thread status
{
   WORKERID=$1
   THREADID=$2
   ACTION=$3    #setactive | setfree | update
   AGE=$4

   TS=$(date +%s)

   COL=$[(($WORKERID-1)/50)*40]
   ROW=$[(($WORKERID-1)%50)+1]

   case $ACTION in
      "setactive" )
         touch /tmp/$ME.$F1$WORKERID  #redundant - see main loop
         #echo created file $ME.$F1$WORKERID >> $DBG
         plot $COL $ROW "Worker$WORKERID: ACTIVE-TID:$THREADID INIT    " good
         ;;
      "update" )
         plot $COL $ROW "Worker$WORKERID: ACTIVE-TID:$THREADID AGE:$AGE" warn
         ;;
      "setfree" )
         plot $COL $ROW "Worker$WORKERID: FREE                         " fail
         rm /tmp/$ME.$F1$WORKERID
         ;;
      * )

      ;;
   esac
}

getfreeworkerid()
{
   for i in $(seq 1 $[$THREADLIMIT+1])
   do
      if [ ! -e /tmp/$ME.$F1$i ];then
         #echo "getfreeworkerid returned $i" >> $DBG
         break
      fi
   done
   if [ $i -eq $[$THREADLIMIT+1] ];then
      #echo "no free threads" >> $DBG
      echo 0
      #exit
   else
      echo $i
   fi
}

updateIPC()
{
   COMPLETE=$(cat $IPC)        #read IPC
   COMPLETE=$[$COMPLETE+1]     #increment IPC
   echo $COMPLETE > $IPC       #write back to IPC
}


worker()
{
   WORKERID=$1
   THREADID=$2
   #echo "new worker WORKERID:$WORKERID THREADID:$THREADID" >> $DBG

   #accessing common terminal requires critical blocking section
   (flock -x -w 10 201
      trackthread $WORKERID $THREADID setactive
   )201>/tmp/$ME.lock

   let "RND = $RANDOM % $MAXTHREADDUR +1"

   for s in $(seq 1 $RND)               #simulate random lifespan
   do
      sleep 1;
      (flock -x -w 10 201
         trackthread $WORKERID $THREADID update $s
      )201>/tmp/$ME.lock
   done

   (flock -x -w 10 201
      trackthread $WORKERID $THREADID setfree
   )201>/tmp/$ME.lock

   (flock -x -w 10 201
      updateIPC
   )201>/tmp/$ME.lock
}

threadcount()
{
   TC=$(ls /tmp/$ME.$F1* 2> /dev/null | wc -l)
   #echo threadcount is $TC >> $DBG
   THREADCOUNT=$TC
   echo $TC
}

status()
{
   #summary status line
   COMPLETE=$(cat $IPC)
   plot 1 $[$THREADLIMIT+2] "WORKERS $(threadcount)/$THREADLIMIT  SPAWNED $SPAWNED/$SPAWN  COMPLETE $COMPLETE/$SPAWN SF=$SPEEDFACTOR TIMING=$TPS"
   echo -en '\033[K'                   #clear to end of line
}

function main()
{
   while [ $SPAWNED -lt $SPAWN ]
   do
      while [ $(threadcount) -lt $THREADLIMIT ] && [ $SPAWNED -lt $SPAWN ]
      do
         WID=$(getfreeworkerid)
         worker $WID $SPAWNED &
         touch /tmp/$ME.$F1$WID    #if this loops faster than file creation in the worker thread it steps on itself, thread tracking is best in main loop
         SPAWNED=$[$SPAWNED+1]
         (flock -x -w 10 201
            status
         )201>/tmp/$ME.lock
         sleep $TPS
        if ((! $[$SPAWNED%100]));then
           #rethink thread timing every 100 threads
           threadspeed
        fi
      done
      sleep $TPS
   done

   while [ "$(threadcount)" -gt 0 ]
   do
      (flock -x -w 10 201
         status
      )201>/tmp/$ME.lock
      sleep 1;
   done

   status
}

clear
threadspeed
main
wait
status
echo
2
Josiah DeWitt