
所以我有一個舊資料夾,裡面有很多東西。我認為到處都有重複的文件。
是否值得先做一個 squashfs 備份?還是我應該只是7zip它?
這是我的備份技巧方法:
apt install -y squashfs-tools ;
cd /mnt/BackupDrive
mksquashfs /mnt/OldSourceDrive/ Backup-Deduped.squashfs
-keep-as-directory
答案1
先前的答案指出 Squashfs 不進行重複偵測,這是不正確的。 Squashfs 明確偵測重複文件,並且只儲存資料一次。這是在壓縮之前並且完全獨立的。
順便說一句,Mksquashfs 的輸出會告訴您有多少重複檔案。
您也可以變更預設壓縮演算法以及區塊大小(gzip 和 128K)。這將實現更好的壓縮。
mksquashfs /mnt/OldSourceDrive/ Backup-Deduped.squashfs -keep-as-directory -comp xz -b 1M
答案2
您特別提到您有重複的文件,因此值得指出的是,一般來說,檔案系統或存檔壓縮格式不會刪除重複檔案之間的冗餘。 tar.gz 是個例外,但即使如此,它也不會對重複檔案所佔用的空間產生巨大影響。如果重複文件是您想要壓縮的主要原因,那麼最好執行一些操作,例如在其上執行重複文件查找器並刪除任何重複項或將其硬連結在一起(請參閱這裡)。
如果您只需要一次壓縮一堆內容,並且不需要連續存取將新檔案寫入該存檔,那麼最簡單的方法就是將其壓縮(可以使用 7-zip)。請注意,現在大多數人的驅動器上的大部分空間都被無法壓縮的檔案格式佔用(例如電影、照片)。