web-dev-qa-db-ja.com

SGE(Sun Grid Engine)からノードを一時的に取り出すにはどうすればよいですか?

特定のノードで問題が発生しています。それを解決するまで、iiでジョブを実行したくありません。このノードをノード「プール」から一時的に削除するにはどうすればよいですか?

5
David B

無効にするには:

qmod -d *@node_name

再度有効にするには:

qmod -e *@node_name
6
user322498

6.1以降を実行している場合は、次の方法が最適です。 @disabledという名前の新しいホストグループを作成します

qconf -ahgrp @disabled

で新しいリソースクォータセットを作成します

qconf -arqs limit hosts @disabled to slots=0

ここで、ホストを無効にするには、ホストグループに追加するだけです。

qconf -aattr hostgroup hostlist MYHOST @disabled

ホストを再度有効にするには、ホストグループからホストを削除します

qconf -dattr hostgroup hostlist MYHOST @disabled

このプロセスにより、新しいジョブがマシンにスケジュールされるのを停止し、現在実行中のジョブを完了できるようになります。

1

あなたのSGEバージョンを知らなければ、これが望ましい結果を達成することは確かではありませんが、qconf -de fooは実行ホストを削除しますfooqconf -ae fooは、ホストfooを実行リストに追加します。

0
Tok