SLURMクラスターでは、squeue
を使用してシステム上のジョブに関する情報を取得できます。
「R」はr unning;を意味することを知っています。 「PD」はp en d ingを意味しますが、「CG」とは何ですか?
私はそれを経験から「キャンセル」または「失敗」と理解していますが、ジョブが成功したときに「CG」が適用されますc loses? [〜#〜] g [〜#〜]とは何ですか?
「CG」は「completing」を意味します。おそらくI/O操作のために終了できないジョブ。
これは、Slurmトラブルシューティングガイドの 'squeue'セクション にあります。
状態
ジョブ状態、拡張フォーム:PENDING、RUNNING、STOPPED、SUSPENDED、CANCELLED、COMPLETING、COMPLETED、CONFIGURING、FAILED、TIMEOUT、PREEMPTED、NODE_FAIL、REVOKEDおよびSPECIAL_EXIT。詳細については、以下のジョブ状態コードのセクションを参照してください。 (ジョブのみに有効)
状態コンパクト
ジョブ状態、コンパクト形式:PD(pending)、R(running)、CA(cancelled)、CF(configuring)、CG(completing)、CD(完了)、F(失敗)、TO(タイムアウト)、NF(ノード障害)、RV(失効)、SE(特別な終了状態)詳細については、下記の「ジョブ状態コード」セクションを参照情報(ジョブにのみ有効)