バックアップには Squashfs ですか? それとも tar.gz ですか? (古い PC に保存したジャンク ファイルがおそらく重複しています... Squashfs は価値がありますか?)

バックアップには Squashfs ですか? それとも tar.gz ですか? (古い PC に保存したジャンク ファイルがおそらく重複しています... Squashfs は価値がありますか?)

たくさんのものが入った古いフォルダがあります。あちこちに重複したファイルがあると思います。

最初に squashfs バックアップを実行する価値はありますか? それとも 7zip で圧縮するべきでしょうか?

これが私のバックアップトリックの方法である:

apt install -y squashfs-tools ; 
cd /mnt/BackupDrive
mksquashfs /mnt/OldSourceDrive/ Backup-Deduped.squashfs
-keep-as-directory

答え1

Squashfs は重複検出を行わないという前の回答は誤りです。Squashfs は重複ファイルを明示的に検出し、データを 1 回だけ保存します。これは圧縮の前であり、圧縮とは完全に別個のものです。

ちなみに、Mksquashfs の出力には重複ファイルがいくつあるかがわかります。

また、デフォルトの圧縮アルゴリズムとブロック サイズを gzip と 128K から変更します。これにより、圧縮率が向上します。

mksquashfs /mnt/OldSourceDrive/ Backup-Deduped.squashfs -keep-as-directory -comp xz -b 1M

答え2

重複ファイルがあると具体的に述べられているので、一般的にファイルシステムやアーカイブの圧縮形式では重複ファイル間の冗長性は削除されないことを指摘しておく価値があります。例外は tar.gz ですが、それでも重複ファイルが占めるスペースに大きな違いはありません。重複ファイルが圧縮の主な理由である場合は、重複ファイルファインダーを実行して重複ファイルを削除するか、ハードリンクするなどの操作を行うことをお勧めします (ここ)。

一度に大量のファイルを圧縮する必要があり、そのアーカイブに新しいファイルを書き込むために継続的にアクセスする必要がない場合は、単に zip で圧縮するのが最も簡単です (7-zip を使用できます)。最近のほとんどの人のドライブでは、圧縮されないファイル形式 (映画、写真など) によってスペースの大部分が占められていることに注意してください。

関連情報