web-dev-qa-db-ja.com

`sem`を使用してスクリプトを並行して実行する

次のシェルスクリプト(1つのライナー)があります。これを使用して、まったく同じ内容のディレクトリを識別します。重複する(子)ディレクトリを識別して削除するために使用しています。

同じスクリプトをsemで実行しようとすると、No such file or directoryエラーが発生します。

例-並列スレッドなし

find -type d -links 2 | while read i; do \
   find "$i" -type f -print0 | xargs -r0 md5sum | awk '{ print $1 }' \
   | sort | md5sum | xargs -I {} echo {} $i ; \
   done

私に与える:

e94d32e2a683d46d49c7580d649f7888  - ./Daft Punk/Alive 2007 2
e94d32e2a683d46d49c7580d649f7888  - ./Daft Punk/Alive 2007

例-semを使用

find -type d -links 2 | while read i; do sem -j+0 \
   find "$i" -type f -print0 | xargs -r0 md5sum | awk '{ print $1 }' \
   | sort | md5sum | xargs -I {} echo {} $i ; \
   done; sem --wait

私に与える:

find: `./Daft': No such file or directory
find: `Punk/Alive': No such file or directory
find: `2007': No such file or directory
find: `2': No such file or directory
d41d8cd98f00b204e9800998ecf8427e  - ./Daft Punk/Alive 2007 2
find: `./Daft': No such file or directory
find: `Punk/Alive': No such file or directory
find: `2007': No such file or directory
d41d8cd98f00b204e9800998ecf8427e  - ./Daft Punk/Alive 2007

質問:

  1. なぜ行動の違い?
  2. semスクリプトからNo such file or directoryを削除/修正するにはどうすればよいですか?
  3. スクリプトで他に改善できることはありますか? (awkxargsがたくさんあります)
1
Nick Grealy

最も簡単な解決策は、semに渡されたコマンドを引用することです。

sem -j+0 "find \"$i\" -type f -print0"

この例で違いがわかります

$ sem -j 8 echo "a  a" 
a a
$ sem -j 8 'echo "a  a"' 
a  a
2
meuh

代わりに並列を使用してください:

doit() {
  i="$1"
  find "$i" -type f -print0 | xargs -r0 cat | md5sum |
    awk '{ print $1 }' |
    sort | md5sum
}
export -f doit
find -type d -links 2 | parallel --tag doit
1
Ole Tange