web-dev-qa-db-ja.com

新しいドメインに参加した後、Microsoft HPC Pack 2012R2がNetworkDirectで実行されない

MS HPC Pack 2012 R2を使用して、Windows Server 2012R2で実行されている13台のコンピュータークラスターを使用しています。ヘッドノードは正常に機能しています。サーバーは、標準アダプター上のIPv4を介して企業ネットワークに接続されます。ただし、ノードはinfiniBandを介して相互に接続されています。

1週間前、クラスターは同じホスト名の新しいドメインに移動されました。 FQDNはもちろん変更され、Network Directが12の計算ノードすべてでfalseに設定されていることを除いて、ほとんどの方法で正しく動作しています。

移行後、ヘッドノードにはすべてのHPCコンポーネントが再インストールされました。ノードはそのまま残されました。これがネットワークダイレクトが有効になっている理由だと思ったので、ノードの1つにHPCを再インストールしようとしました。それは問題を解決しませんでした。

Windowsファイアウォールは、ヘッドノードを含むすべてのノードのすべてのレベルでオフになっています。

  • ヘッドノードのifiniBandアダプター:Mellanox ConnectX-3 ProIPoIBアダプター
  • ノード上のinifiniBandアダプター:HP 10Gb/40Gb2ポート544+ FLR-QSFPIPoIBアダプター

サーバーは、infiniBandアダプターに設定されたIPでのPING要求に応答します。

誰かこれについて何かアイデアがありますか?前もって感謝します。

3

Mellanox NICをイーサネットにフラッシュして、すべてが確実に機能するようにします。 InfiniBand with WindowsはそのようなPITAです!

http://www.mellanox.com/page/firmware_table_ConnectX3IB

2
NISMO1968