概要:私の問題は、ホストがpingを実行できるにもかかわらず、ESXホストからNFSデータストアとしてQNAP NFSサーバーを使用できないことです。私はすべてのネットワークトラフィック(NFSを含む)と各vmkernelアダプターのサブネットにLACPアップリンクを備えたvDSを利用しています。
セットアップ:vSphereを評価していて、2つのvSphere ESX 5.5ホスト(node1とnode2)があり、それぞれに4x NICがあります。 LACP/802.3adを使用してスイッチとチーム化し、各ホストのLAGをアップリンクとして2つのホスト間に分散スイッチを作成しました。ネットワーキングはすべて分散型スイッチを経由します。理想的には、DRSと冗長性を利用したいと考えています。ドメインコントローラーVM( "Central")およびvCenter VM( "vCenter")がnode1で実行されており(node1のローカルデータストアを使用)、両方のホストが接続されている両方のホストがvCenterデータセンター内にあり、HAとDRSが現在無効になっているクラスターにあります。
QNAP TS-669 Pro(バージョン4.0.3)(TS-x69シリーズはVMware Storage HCL上にあります)をNFSデータストアのNFSサーバーとして使用します。802.3adとスイッチを組み合わせて2x NICがチーム化されています。
vmkernel.log:ホストのvmkernel.logからのエラーはあまり役に立ちません:
NFS: 157: Command: (mount) Server: (10.1.2.100) IP: (10.1.2.100) Path: (/VM) Label (datastoreNAS) Options: (None) cpu9:67402)StorageApdHandler: 698: APD Handle 509bc29f-13556457 Created with lock[StorageApd0x411121]
cpu10:67402)StorageApdHandler: 745: Freeing APD Handle [509bc29f-13556457]
cpu10:67402)StorageApdHandler: 808: APD Handle freed!
cpu10:67402)NFS: 168: NFS mount 10.1.2.100:/VM failed: Unable to connect to NFS server.
ネットワークセットアップ:これが私の 分散スイッチのセットアップ(JPG)です。 これが私のネットワークです。
vSphereアドレス
その他の住所
次の設定でCisco SRW2024Pレイヤー2スイッチ(ジャンボフレームが有効)を使用しています。
各サブネットは別のサブネットにルーティング可能ですが、vmk1からNFSサーバーへの接続には必要ありません。他のすべてのトラフィック(vSphere Web Client、RDPなど)は、この設定を適切に通過します。専用の物理NIC=でVMware Workstationセットアップの上部にあるESXホストVMを使用して、QNAP NFSサーバーを事前にテストしましたが、問題はありませんでした。
NFSサーバー共有のACLは許容範囲内であり、すべてのサブネット範囲に共有へのフルアクセスを許可します。
node1 vmk1からQNAPにpingを実行できます。NFSに使用する必要があるアダプターです。
~ # vmkping -I vmk1 10.1.2.100
PING 10.1.2.100 (10.1.2.100): 56 data bytes
64 bytes from 10.1.2.100: icmp_seq=0 ttl=64 time=0.371 ms
64 bytes from 10.1.2.100: icmp_seq=1 ttl=64 time=0.161 ms
64 bytes from 10.1.2.100: icmp_seq=2 ttl=64 time=0.241 ms
Netcatはエラーをスローしません:
~ # nc -z 10.1.2.100 2049
Connection to 10.1.2.100 2049 port [tcp/nfs] succeeded!
Node1のルーティングテーブル:
~ # esxcfg-route -l
VMkernel Routes:
Network Netmask Gateway Interface
10.1.1.0 255.255.255.0 Local Subnet vmk0
10.1.2.0 255.255.255.0 Local Subnet vmk1
10.1.3.0 255.255.255.0 Local Subnet vmk2
10.1.4.0 255.255.255.0 Local Subnet vmk3
default 0.0.0.0 10.1.1.254 vmk0
VMカーネルNIC情報
~ # esxcfg-vmknic -l
Interface Port Group/DVPort IP Family IP Address Netmask Broadcast MAC Address MTU TSO MSS Enabled Type
vmk0 133 IPv4 10.1.1.1 255.255.255.0 10.1.1.255 00:50:56:66:8e:5f 1500 65535 true STATIC
vmk0 133 IPv6 fe80::250:56ff:fe66:8e5f 64 00:50:56:66:8e:5f 1500 65535 true STATIC, PREFERRED
vmk1 164 IPv4 10.1.2.1 255.255.255.0 10.1.2.255 00:50:56:68:f5:1f 1500 65535 true STATIC
vmk1 164 IPv6 fe80::250:56ff:fe68:f51f 64 00:50:56:68:f5:1f 1500 65535 true STATIC, PREFERRED
vmk2 196 IPv4 10.1.3.1 255.255.255.0 10.1.3.255 00:50:56:66:18:95 1500 65535 true STATIC
vmk2 196 IPv6 fe80::250:56ff:fe66:1895 64 00:50:56:66:18:95 1500 65535 true STATIC, PREFERRED
vmk3 228 IPv4 10.1.4.1 255.255.255.0 10.1.4.255 00:50:56:72:e6:ca 1500 65535 true STATIC
vmk3 228 IPv6 fe80::250:56ff:fe72:e6ca 64 00:50:56:72:e6:ca 1500 65535 true STATIC, PREFERRED
私が試した/チェックしたもの:
esxcli network firewall set --enabled false
私は次に何をしようかというアイデアが足りません。 VMware Workstationのセットアップとは異なる方法で行っていることは、物理スイッチと2つのホスト間の仮想分散スイッチでLACPを使用することです。私はvDSがおそらく私のトラブルの原因であると思いますが、この問題を解消せずに修正する方法がわかりません。
私はあきらめた。
LACPをアップリンクから削除し、マルチパスを使用してiSCSIに切り替えました(SANのみのポートグループと各アップリンクに関連付けられたvmk)。
うーん... vDS、NFS、LACPは私にとってはうまくいきます。ただし、vSphere機能のハイエンドセットを使用して、かなり深く作業を始めているようです。ほとんどのインストールではLACPは必要ありませんが、使用しようとすることの魅力は理解できます...
QNAPがマウントを許可していない場合、vDSやその他の機能は重要ではありません...
vmkping
で接続を確認しましたが、おそらくジャンボMTUで試してください:vmkping -s 9000 10.1.2.100
(インターフェースを指定する必要はありません)。それが機能することを確認します。ip.address:/share/VM/
/var/log/vobd.log
のメッセージに注意してください。 「マウント要求がNFSサーバーによって拒否されました。」のように表示される場合、問題はQNAPです。VDS構成のスクリーンショットは、1つのホストに相当する情報のようです。構成にLACPがあり、適切な負荷分散モードが設定されていることを確認します。次のようになります。
tS-420UとESXi 5.5 U1で昨日同じ問題がありました。 マイセットアップ:-vCenterサーバーを備えた2つのESXi 5.5-直接接続ストレージ-QNAP TS-420U NAS(ルーティングの問題がないため)-すべてサブネット10.207.253.128/26にあります
NASを構成した後、ACLを適切なサブネット(10.207.253。*)に設定し、問題なく接続しました。しかし、ESXiホストを再起動すると、接続はなくなり、同じエラーが発生します。 NAS再起動してNFSサービスをオフ/オンにしても効果がありませんでした。最後に試したのは、ACLをNASサーバーを*->ブームに設定することでした。どちらのESXiホストも問題なくNFS共有に接続できます。
次に、ESXiホストがサブネットに設定されたACLで接続できない理由を確認する必要があります...
残念ながら、ESXiには診断コマンドrpcinfo
およびshowmount
が含まれていません。デフォルトでは、NFSはUDPを使用します。マウントを実行するには、システムがNFSサーバーのrpcポートマッパー(tcp/udpポート111)と通信できる必要があります。これにより、mountd
およびnfs
サービスのポートが提供されます。他のシステムでは、rpcinfo -p <ip>
を使用してポートマップが機能していることを確認し、showmount -e <ip>
を使用して何がエクスポートされているかを確認します。
また、vMotion、FTロギング、iSCSIとは異なり、NFSは特定のvmkにロックされません。利用可能なインターフェースを使用します。 NFSサーバーと同じサブネットにインターフェースがあるので、それはすべきそれを使用します。
NASにログがある場合は、そこに手掛かりがないか確認してください。それ以外の場合は、単一のリンクに戻り、トラフィックを監視することが唯一の手段になります。 (そのスイッチはポートミラーリングを行いますか?)