web-dev-qa-db-ja.com

PBS / Torqueでの非独占的なジョブスケジューリング

クラスターリソースマネージャーのTorqueは通常、計算ノードを排他的に割り当てます。ただし、マルチコア計算ノードに対して実行されている小さなジョブが多数ある場合(私たちのように)、これにより多くのリソースが無駄になる可能性があります。計算ノードでコアの非排他的割り当てを許可するようにTorqueを構成する方法はありますか?

(これらのジョブはすべて驚異的並列であるため、共有ネットワークリソースの競合については心配していません。お客様のジョブスクリプトはすべてPBS/Torqueであるため、スケジューラーを切り替えることはできません。)

1
ajdecon

OK、これは実際にはマウイの問題であることが判明しました。他の人が一日を無駄にする必要がないように、私はここに答えを投げています。 :)

まず、Torque nodesファイルにnp引数を持つノード、つまりnodename np=8をリストします。これにより、リソースマネージャーが正しいプロセッサー数を認識できるようになります。

次に、マウイの場合:maui.cfgファイルにNODEACCESSPOLICY SHAREDという行が含まれていることを確認します。そうすれば、非排他的スケジューリングが機能するはずです。

1
ajdecon