ISCSI経由で公開されたHP LeftHandストレージを備えたESXiボックスがあります。
1TBのディスクを持つ仮想マシンがあり、そのうち800GBが消費されます。ディスクは、LeftHandストレージでシックプロビジョニングされています。
VM(Veeam Backup and Recoveryが実行できるようにするため)でスナップショットが開いており、約6時間開いていました。この間に約5GBの差分ディスクが作成されました。
スナップショットの削除に5時間以上かかりましたが、まだ完了していません。ストレージアレイは、そのアレイでIOPSを事実上報告せず(約600、背景ノイズ)、スループット(約8MB /秒、これも背景ノイズ)、平均キュー深度9。
言い換えれば、スナップショット統合プロセスはIOバインドされていないようです。スナップショットの削除が非常に遅くなる原因となっているものは何も見えません。それはis動作し、デルタファイルを監視して判断します。
この(比較的小さい)スナップショットの削除が非常に遅いのはなぜですか。
VMWareのドキュメント のように、私はls -lh | grep -E "delta|flat|sesparse"
現在、変更されている2つのデルタファイルが表示されます。
-rw------- 1 root root 194.0M Jun 15 01:28 EXAMPLE-000001-delta.vmdk
-rw------- 1 root root 274.0M Jun 15 01:27 EXAMPLE-000002-delta.vmdk
統合プロセス中に別のスナップショットファイルがデルタを収集している間に、1つのスナップショットファイルが統合されていると推測しています。次に、新しいものが統合され、そのプロセス中に別のデルタが作成されます。
ファイルサイズareは反復ごとに(したがって、ほとんどの反復)低下するので、最終的にこの統合手順が完了すると思います(おそらく、 VMをネットワークから30分間オフにして、変更を生成せずにこれを終了します)。
デルタ100メグあたり約2分で統合されます。これは確かに前に起こったことはありません。通常のVeeamバックアップでのスナップショットの削除には、約40分かかります(確かに速くはありませんが、これほど遅くはありません)。
6時間2分後、最終的にスナップショットが削除されます。ただし、通常この種の問題(ストレージのパフォーマンス以外)のトラブルシューティングを行う方法があるかどうかを知りたいです。
ESXIスナップショットの削除には長い時間がかかる(通常はかかる)ことは理解しています。スナップショットを削除する前に、古いスナップショットからの変更を順番に次のスナップショットに書き込む必要があります。私は、このプロセスを可能な限り迅速かつ効率的に実行できるように、常に古いものから最新のものへとスナップショットを削除するように教えられました。
当然、スナップショット間の変更が多いほど、マージにかかる時間が長くなります。