web-dev-qa-db-ja.com

qsub経由で送信されたジョブを一時停止することはできますか?

小さなクラスターでジョブを実行しています。 qsub経由で提出しました。現在、私のラボメートは私よりも緊急にリソースを必要としているため、可能であれば、ジョブを強制終了するか一時停止する必要があります。

ジョブを一時停止して、CPU、RAMなどを解放する方法はありますか?

私は通常のユーザーです(root権限はありません)。

10
Sibbs Gambling

ジョブが開始していない場合は、 qhold を使用してジョブを保留できます。再起動するには qrls を使用します。

qhold <job ID>
qrls <job ID>

それらがすでに実行されている場合は、 qsig を使用してジョブを一時停止および再開できます(そのための追加の権限が必要な場合があります。その場合は管理者に問い合わせてください)。

qsig -s suspend <job ID>
qsig -s resume <job ID>

ジョブを再開したら、強制的に qrun で実行する必要があります。

qrun <job ID>

PBSPro 13.0.2.153173を搭載したSLES 11 SP4システムでテストしましたが、他のPOSIX準拠のバッチジョブ送信システムでも動作するはずです。

6
Calimo