
그래서 나는 많은 것들을 담은 오래된 폴더를 가지고 있습니다. 여기 저기 중복된 파일이 있는 것 같아요.
먼저 squashfs 백업을 수행하는 것이 가치가 있습니까? 아니면 그냥 7zip으로 압축해야 하나요?
내 백업 트릭 방법은 다음과 같습니다.
apt install -y squashfs-tools ;
cd /mnt/BackupDrive
mksquashfs /mnt/OldSourceDrive/ Backup-Deduped.squashfs
-keep-as-directory
답변1
Squashfs가 중복 감지를 수행하지 않는다는 이전 답변이 올바르지 않습니다. Squashfs는 중복 파일을 명시적으로 감지하고 데이터를 한 번만 저장합니다. 이는 압축 이전이며 압축과 완전히 별개입니다.
그런데 Mksquashfs의 출력은 중복 파일 수를 알려줍니다.
또한 기본 압축 알고리즘과 블록 크기를 gzip 및 128K에서 변경합니다. 이렇게 하면 더 나은 압축이 달성됩니다.
mksquashfs /mnt/OldSourceDrive/ Backup-Deduped.squashfs -keep-as-directory -comp xz -b 1M
답변2
중복 파일이 있다고 구체적으로 언급하셨으므로 일반적으로 파일 시스템이나 아카이브 압축 형식은 중복 파일 간의 중복성을 제거하지 않는다는 점을 지적할 가치가 있습니다. tar.gz는 예외이지만, 그래도 중복 파일이 차지하는 공간에는 큰 차이가 없습니다. 중복 파일이 압축하려는 주된 이유인 경우 중복 파일 찾기를 실행하고 중복 파일을 제거하거나 함께 하드 링크하는 것과 같은 작업을 수행하는 것이 좋습니다(참조여기).
여러 항목을 한 번만 압축해야 하고 해당 아카이브에 새 파일을 쓰기 위해 지속적인 액세스가 필요하지 않은 경우 압축하는 것이 가장 쉽습니다(7-zip 사용 가능). 요즘 대부분의 사람들의 드라이브에서는 압축되지 않는 파일 형식(예: 영화, 사진)이 공간의 대부분을 차지하고 있습니다.