私はグーグルを検索して、ドキュメントを読みました。
私のローカルクラスターはSLURMを使用しています。次のことを確認したいと思います。各ノードにはいくつのコアがありますか?キュー内の各ジョブはいくつのコアを予約していますか?
何かアドバイスをいただければ幸いです!
使用できるすべてのノードの詳細を表示するために:
scontrol show node
特定のノードの場合:
scontrol show node "nodename"
そして、ジョブのコアには、フォーマットマーク%Cを使用できます。例:
squeue -o"%.7i %.9P %.8j %.8u %.2t %.10M %.6D %C"
詳細 情報 フォーマットについて。
クラスター内のノードに関するほとんどの情報は、sinfo
コマンドを使用して、たとえば次のように取得できます。
sinfo --Node --long
パーティション、ノードの状態、ソケットの数、コア、スレッド、メモリ、ディスク、および機能に関する要約情報が得られます。 scontrol show nodes
の出力よりも読みやすいです。
各ジョブのCPU数については、@ Sergio Iserteの回答を参照してください。
マンページ here を参照してください。