小さなクラスターでジョブを実行しています。 qsub
経由で提出しました。現在、私のラボメートは私よりも緊急にリソースを必要としているため、可能であれば、ジョブを強制終了するか一時停止する必要があります。
ジョブを一時停止して、CPU、RAMなどを解放する方法はありますか?
私は通常のユーザーです(root権限はありません)。
ジョブが開始していない場合は、 qhold
を使用してジョブを保留できます。再起動するには qrls
を使用します。
qhold <job ID>
qrls <job ID>
それらがすでに実行されている場合は、 qsig
を使用してジョブを一時停止および再開できます(そのための追加の権限が必要な場合があります。その場合は管理者に問い合わせてください)。
qsig -s suspend <job ID>
qsig -s resume <job ID>
ジョブを再開したら、強制的に qrun
で実行する必要があります。
qrun <job ID>
PBSPro 13.0.2.153173を搭載したSLES 11 SP4システムでテストしましたが、他のPOSIX準拠のバッチジョブ送信システムでも動作するはずです。