SSHを使用してESXi5.1U1をESXi5.1 U2にアップグレードしました。アップグレードが完了した後、サーバーを再起動しました。vSphereClientを使用してサーバーに接続できませんでしたが、数時間後にSSHを使用して接続できました。SSHも機能しなくなりましたが、すべて私のVMのいくつかは正しく動作します。
サーバーを再起動しようとしましたが、vSphere Clientを使用して接続できず、SSHを使用できる状況が繰り返されます。
サーバーがデータセンターにあるため、サーバー画面とキーボードへのアクセスが制限されています(可能ですが、コストがかかります)。
Vmkernel.logの一部は次のとおりです。
2014-02-24T23:45:01.296Z cpu5:521314)ALERT: hostd detected to be non-responsive
2014-02-24T23:50:01.297Z cpu1:521473)WARNING: Tcpip: 1304: socreate(type=2, proto=0) failed with error No buffer space available (55)
2014-02-24T23:52:07.996Z cpu2:519491)WARNING: LinScsi: SCSILinuxQueueCommand:1193:queuecommand failed with status = 0x1056 Unknown status
vmhba33:0:0:0 (driver name: ahci) - Message repeated 2194 times
2014-02-24T23:52:09.421Z cpu0:6262)ScsiDeviceIO: 2318: Cmd(0x4124007a2140) 0x2a, CmdSN 0x800000e4 from world 6549 to dev "t10.ATA_____TOSH
IBA_DT01ACA300_________________________________33815YEAS" failed H:0x0 D:0x8 P:0x0 Possible sense data: 0x0 0x0 0x0.
私はまったく同じ問題を抱えていました。 ESXiのログファイルには、クライアントが接続を閉じたことが記載されています。
ESXi 5.5にアップグレードした後、私は明らかに新しいクライアントもインストールする必要がありました。インストール中に、オペレーティングシステムが原因でESXサーバーへの接続に問題がある可能性があるという通知がありました(Windows XP SP 3)。実際、私はまったく同じエラーメッセージでESXi5.5に接続できませんでした。
そこで、Windows 8.1ボックスをセットアップし、そこにvSphere Client 5.5をインストールして、ESXi 5.5U1(ビルド1746018)に正常に接続できました。
注:クライアントOSをXP以上に更新できない場合は、次の回避策を検討してください。
esxcli software profile install -d https://hostupdate.vmware.com/software/VUM/PRODUCTION/main/vmw-depot-index.xml -p ESXi-5.1.0-20131004001-standard --ok-to-remove
(このコマンドはESXiコンソールで発行されます。「esxcli.exe-s vm.Host.fqdn -u root ...」などを使用してリモートで実行することもできます。ESXiファイアウォールでhttpClient接続を許可するか、ローカルリポジトリ。詳細については、たとえば @ v-front を参照してください。
ESXiホストのローカルストレージに問題があると思われます。 VMはどこにありますか?共有ストレージ上? ESXiのインストールとは異なるアレイコントローラーで?
いずれにせよ、この場合のSSH識別エラーは、ホストがディスクから読み取ることができないことを示している可能性があります。ネットワークスタックとSSHデーモンがRAMで実行されていることを忘れないでください。これがホストサーバーであることを考えると、機器がローエンドであり、ストレージの問題が発生している可能性があります。
オンプレミスのハードウェアの状態を評価できる人に対処します。
編集:
独自のアップデートは、3TBコンシューマーSATAドライブの問題を示しています。Toshiba_DT01ACA300
またはそれが接続されているディスクコントローラ。これはハードウェアの問題です。
Sshセッションから/sbin/services.sh restart
を使用して管理エージェントを再起動できるはずです。
なぜあなたのsshが数時間後に動作を停止するのか分かりません。