クラスターでは、N個のCPUで実行するためにジョブが送信されます。 qstat -fは、ジョブが時間以外に使用しているCPUリソースの量を示しません。各CPUパワーが100%使用されているかどうかをどのように確認しますか?タスクに必要なリソースを決定することが不可欠です。
このドキュメント 解決策を示しました。pdshを使用してノードの「top」の出力を確認するか、ジョブが複数のノードで実行されている場合は「all」コマンドを使用してください。
pdsh -j 123456 top -b -n 1 -u usr1234