sinfo
を使用すると、次のようになります。
$ sinfo
PARTITION AVAIL TIMELIMIT NODES STATE NODELIST
[...]
RG3 up 28-00:00:0 1 drain rg3hpc4
[...]
状態「ドレイン」はどういう意味ですか?
これは、そのノードでこれ以上ジョブがスケジュールされないことを意味しますが、現在実行中のジョブは実行を継続します(ノードで実行中のすべてのジョブを強制終了するノードdown
を設定するのとは対照的)。
多くの場合、ノードはその状態に設定されているため、実行中のすべてのジョブが終了すると、メンテナンス操作を実行できます。
scontrolのマンページ コマンドから:
ノードをサービスから削除する場合は、通常、その状態を「DRAIN」に設定します
システム管理者がノードをドレインした理由を示した可能性が最も高いことに注意してください。その理由は、
sinfo -R