mpiexec -16 ...
を384 GB RAMサーバーで実行しようとしましたが、OOM Killerが誘発され、中止されました。
mpiexec
実行のメモリ制限を設定するにはどうすればよいですか?
ulimit
は知っていますが、他のプロセスに影響する可能性があります。
ありがとうございました。
これは cgroups
を使用して実行できると思います。
メモリ制限(たとえば50GB)を使用して、mpigroup
(または任意の名前)という名前のcgroupを作成します。
cgcreate -g memory,cpu:mpigroup
cgset -r memory.limit_in_bytes=$((50*1024*1024*1024)) mpigroup
次に、mpiexecが既に実行されている場合は、次のcgroupに追加します。
cgclassify -g memory,cpu:mpigroup $(pidof mpiexec)
または、このcgroup内でmpiexec
を実行します。
cgexec -g memory,cpu:mpigroup mpiexec -16 ...