クラスターリソースマネージャーのTorqueは通常、計算ノードを排他的に割り当てます。ただし、マルチコア計算ノードに対して実行されている小さなジョブが多数ある場合(私たちのように)、これにより多くのリソースが無駄になる可能性があります。計算ノードでコアの非排他的割り当てを許可するようにTorqueを構成する方法はありますか?
(これらのジョブはすべて驚異的並列であるため、共有ネットワークリソースの競合については心配していません。お客様のジョブスクリプトはすべてPBS/Torqueであるため、スケジューラーを切り替えることはできません。)
OK、これは実際にはマウイの問題であることが判明しました。他の人が一日を無駄にする必要がないように、私はここに答えを投げています。 :)
まず、Torque nodes
ファイルにnp引数を持つノード、つまりnodename np=8
をリストします。これにより、リソースマネージャーが正しいプロセッサー数を認識できるようになります。
次に、マウイの場合:maui.cfgファイルにNODEACCESSPOLICY SHARED
という行が含まれていることを確認します。そうすれば、非排他的スケジューリングが機能するはずです。