MS HPC Pack 2012 R2を使用して、Windows Server 2012R2で実行されている13台のコンピュータークラスターを使用しています。ヘッドノードは正常に機能しています。サーバーは、標準アダプター上のIPv4を介して企業ネットワークに接続されます。ただし、ノードはinfiniBandを介して相互に接続されています。
1週間前、クラスターは同じホスト名の新しいドメインに移動されました。 FQDNはもちろん変更され、Network Directが12の計算ノードすべてでfalseに設定されていることを除いて、ほとんどの方法で正しく動作しています。
移行後、ヘッドノードにはすべてのHPCコンポーネントが再インストールされました。ノードはそのまま残されました。これがネットワークダイレクトが有効になっている理由だと思ったので、ノードの1つにHPCを再インストールしようとしました。それは問題を解決しませんでした。
Windowsファイアウォールは、ヘッドノードを含むすべてのノードのすべてのレベルでオフになっています。
に
サーバーは、infiniBandアダプターに設定されたIPでのPING要求に応答します。
誰かこれについて何かアイデアがありますか?前もって感謝します。
Mellanox NICをイーサネットにフラッシュして、すべてが確実に機能するようにします。 InfiniBand with WindowsはそのようなPITAです!