特定のノードで問題が発生しています。それを解決するまで、iiでジョブを実行したくありません。このノードをノード「プール」から一時的に削除するにはどうすればよいですか?
無効にするには:
qmod -d *@node_name
再度有効にするには:
qmod -e *@node_name
6.1以降を実行している場合は、次の方法が最適です。 @disabled
という名前の新しいホストグループを作成します
qconf -ahgrp @disabled
で新しいリソースクォータセットを作成します
qconf -arqs limit hosts @disabled to slots=0
ここで、ホストを無効にするには、ホストグループに追加するだけです。
qconf -aattr hostgroup hostlist MYHOST @disabled
ホストを再度有効にするには、ホストグループからホストを削除します
qconf -dattr hostgroup hostlist MYHOST @disabled
このプロセスにより、新しいジョブがマシンにスケジュールされるのを停止し、現在実行中のジョブを完了できるようになります。
あなたのSGEバージョンを知らなければ、これが望ましい結果を達成することは確かではありませんが、qconf -de foo
は実行ホストを削除しますfoo。 qconf -ae foo
は、ホストfooを実行リストに追加します。