ストレージの重複排除と圧縮の両方にbtrfs関数を使用することを考えています...
私の質問は:それは効率的ですか?
つまり、重複排除と圧縮を同時に効率的に行えるのでしょうか?!
Ubuntu 14.04 64ビットを使用しています。また、クラウドコンピューティング環境でEBS最適化ボリュームの上にraid0で使用することを計画しています...
Tks!チアゴ
bedup
ユーティリティを使用して重複排除について記述している場合、答えは重複排除と圧縮は完全に独立したプロセスです。
重複排除中、ファイルの内容は書き換えられないため(メタデータのみ)、データを圧縮する機会はありません。
圧縮状態はbedup
に対して透過的であることは99%確信しています。なぜなら、btrfsからファイルの元の圧縮されたコンテンツを取得することはほとんど不可能だからです。
一方、古いデータの再圧縮は、ドライブを最適化するときに発生します(たとえば、btrfs filesystem defragment -r -v -clzo /
を使用)。これにより、現在、ファイルの重複排除が解除されます。
現在、オンライン重複排除はありません。計画されていますが、まだ実装されていません。試してみたい場合は、実験的なパッチセット(www.mail-archive.com/linux-btrfs%40vger.kernel.org/msg32862.html)があります。
個人的な経験から、ssdと3つのhddに一度に書き込むとき、hasswell i5 4460でのオンライン圧縮の顕著なパフォーマンスヒットはありません(hddsの1つはxfsでフォーマットされているため、圧縮は実行されませんでした。3つのbtrfsのデフラグ/再圧縮ドライブのCPU負荷は約50%ですが、システムはまだスムーズです。これはlzoであり、圧縮は強制されません(圧縮できない場合、btrfsがファイルの圧縮を停止しない限り+ lzoはzlibより高速です)。 ssdでもドライブ速度。