web-dev-qa-db-ja.com

状態「ドレイン」はどういう意味ですか?

sinfoを使用すると、次のようになります。

$ sinfo
PARTITION AVAIL  TIMELIMIT  NODES  STATE NODELIST
[...]
RG3          up 28-00:00:0      1  drain rg3hpc4
[...]

状態「ドレイン」はどういう意味ですか?

33
Martin Thoma

これは、そのノードでこれ以上ジョブがスケジュールされないことを意味しますが、現在実行中のジョブは実行を継続します(ノードで実行中のすべてのジョブを強制終了するノードdownを設定するのとは対照的)。

多くの場合、ノードはその状態に設定されているため、実行中のすべてのジョブが終了すると、メンテナンス操作を実行できます。

scontrolのマンページ コマンドから:

ノードをサービスから削除する場合は、通常、その状態を「DRAIN」に設定します

システム管理者がノードをドレインした理由を示した可能性が最も高いことに注意してください。その理由は、

sinfo -R
40
damienfrancois