小さなコンピューティングクラスターで Sun Grid Engine を使用することを検討しています。現在のところ、現在の設定はかなり粗雑であり、ジョブを実行するためにオープンマシンにSSH接続するだけです。
手動でジョブを開始することからqsub
を使用してジョブを開始することへの移行を容易にするため、インタラクティブなジョブを許可したいと思います。ただし、そうすると、ユーザーが誤ってインタラクティブセッションをアイドル状態のままにして、他のジョブがマシン上で実行されないようにする可能性があるという懸念があります。以前にOpenPBSを使用してみたところ、スクリーンセッションでインタラクティブなジョブを開いて、基本的にマシンでキャンプするという問題があったため、この問題は理論的なものだけではありません。
アイドル状態のインタラクティブジョブを自動的に強制終了するようにSGEを構成する方法はありますか?これは2007年に拡張機能( Issue#:2447 )として要求されたようです。しかし、要求が実装されたようには見えません。
SGEを適切なデフォルトのウォールタイム(h_rt)に設定して、事前定義された制限の後にセッションを終了することができます。
ユーザーのシェルをアイドル時にタイムアウトさせようとしましたか?詳細と例は http://www.cyberciti.biz/faq/linux-unix-login-bash-Shell-force-time-outs/ にあります。
nayrmilにはいくつかの良い提案があります。もう1つのオプションは、対話型ジョブを実行できるマシンを制限することです。基本的に、一部のノードを「インタラクティブ」として指定し、ノードリソースをオーバーサブスクライブするキューをノードに配置するため、多くのユーザーが一度にログインできます。ユーザーは基本的に好きなだけそこにキャンプすることができますが、実際のリソースにアクセスしたい場合は、適切なジョブを送信する必要があります。