ファイルシステムBTRFSを使用して、EEE PC 701にLubuntu 15.04をインストールしました。データを重複排除したいのですが、方法がわかりません。
何かがうまくいかなくても何も失わないように、完全バックアップを作成することから始めます。
duperemove -d
を探していると思います
「Duperemoveは、重複したエクステントを見つけて重複排除のために送信するためのシンプルなツールです。ファイルのリストが与えられると、ブロックごとにコンテンツをハッシュし、それらのハッシュを相互に比較し、互いに一致するエクステントを見つけて分類します。 -dオプションを指定すると、duperemoveはbtrfs-extent-same ioctlを使用して重複排除のためにそれらのエクステントを送信します。
Duperemoveには2つの主要な動作モードがあり、一方は他方のサブセットです。
読み取り専用/非重複モード
-d(デフォルト)なしで実行すると、duperemoveは重複排除の理想的な候補であると判断した一致するエクステントの1つ以上のテーブルを出力します。その結果、読み取り専用モードは、 '-d'を指定して実行したときにduperemoveが何を行うかを確認するのに役立ちます。出力は、後で重複排除のためにエクステントを送信するために、他のソフトウェアによっても使用される可能性があります。
このモードでは、一致するエクステントのすべてのインスタンスが出力されるわけではなく、重複排除の対象となるインスタンスのみが出力されることに注意してください。
通常、duperemoveは、処理するエクステントの基礎となる表現には関与しません。それらのいくつかは、圧縮されたり、I/Oを受けたり、すでに重複排除されている可能性があります。重複排除モードでは、カーネルがこれらの詳細を処理するため、その作業を複製しないようにします。
重複排除モード
これは、読み取り、ハッシュ、および比較のステップで見つかった重複エクステントが重複排除のために実際に送信されることを除いて、読み取り専用モードと同様に機能します。重複排除された合計データの推定値は、操作の完了後に出力されます。この推定値は、重複排除の前後の各ファイルの共有バイトの合計量を比較することで計算されます。
Duperemoveの実行の詳細については、duperemoveのマニュアルページを参照してください。」
これはbtrfs-toolsパッケージには表示されないようですが、そのためのgitハブページがあります here。 最近のオープンおよびクローズされた問題(別名Pulse)が利用可能 here 。
Ubuntuの現在サポートされているすべてのバージョンのパッケージは、 this PPA にあります。
バックアップを強くお勧めします。参照: https://github.com/markfasheh/duperemove/issues/50
引用元: https://github.com/markfasheh/duperemove
マニュアルページ: https://manpages.debian.org/testing/duperemove/duperemove.8.en.html
私はいつも bedup を使用しました。非常に高速で信頼性があります。このツールは 公式btrfsページ にも記載されています。 duperemoveを使用したことはありません(bedupは古いです)。