sinfo
を使用すると、3つのノードがdrain
状態にあることが示されます。
PARTITION AVAIL TIMELIMIT NODES STATE NODELIST
all* up infinite 3 drain node[10,11,12]
ndrainそのようなノードに使用するコマンドラインはどれですか?
アプローチが見つかったら、scontrolインタープリター(コマンドラインにscontrol
と入力)を入力してから、
scontrol: update NodeName=node10 State=DOWN Reason="undraining"
scontrol: update NodeName=node10 State=RESUME
それから
scontrol: show node node10
他の情報の中で表示する
State=IDLE
更新:これらのノードの一部はDRAIN状態に戻りました。ルートパーティションがいっぱいになったことに気付きました。 show node a10
を示したReason=SlurmdSpoolDir is full
、したがってUbuntuでSudo apt-get clean
削除する /var/cache/apt
コンテンツとgzip圧縮された/var/log
ファイル。
ダウンに設定すると、すべてのジョブが強制終了されます。
代わりにノードをRESUMEに設定します。
現在ノードでジョブが実行されていない場合:
scontrol update nodename=node10 state=idle
ノードでジョブが実行されている場合:
scontrol update nodename=node10 state=resume