Squashfs를 백업하시겠습니까? 아니면 tar.gz? (오래된 PC에 중복된 파일과 함께 저장한 모든 종류의 정크 파일이 있습니다. 아마도... squashfs가 그만한 가치가 있나요?

Squashfs를 백업하시겠습니까? 아니면 tar.gz? (오래된 PC에 중복된 파일과 함께 저장한 모든 종류의 정크 파일이 있습니다. 아마도... squashfs가 그만한 가치가 있나요?

그래서 나는 많은 것들을 담은 오래된 폴더를 가지고 있습니다. 여기 저기 중복된 파일이 있는 것 같아요.

먼저 squashfs 백업을 수행하는 것이 가치가 있습니까? 아니면 그냥 7zip으로 압축해야 하나요?

내 백업 트릭 방법은 다음과 같습니다.

apt install -y squashfs-tools ; 
cd /mnt/BackupDrive
mksquashfs /mnt/OldSourceDrive/ Backup-Deduped.squashfs
-keep-as-directory

답변1

Squashfs가 중복 감지를 수행하지 않는다는 이전 답변이 올바르지 않습니다. Squashfs는 중복 파일을 명시적으로 감지하고 데이터를 한 번만 저장합니다. 이는 압축 이전이며 압축과 완전히 별개입니다.

그런데 Mksquashfs의 출력은 중복 파일 수를 알려줍니다.

또한 기본 압축 알고리즘과 블록 크기를 gzip 및 128K에서 변경합니다. 이렇게 하면 더 나은 압축이 달성됩니다.

mksquashfs /mnt/OldSourceDrive/ Backup-Deduped.squashfs -keep-as-directory -comp xz -b 1M

답변2

중복 파일이 있다고 구체적으로 언급하셨으므로 일반적으로 파일 시스템이나 아카이브 압축 형식은 중복 파일 간의 중복성을 제거하지 않는다는 점을 지적할 가치가 있습니다. tar.gz는 예외이지만, 그래도 중복 파일이 차지하는 공간에는 큰 차이가 없습니다. 중복 파일이 압축하려는 주된 이유인 경우 중복 파일 찾기를 실행하고 중복 파일을 제거하거나 함께 하드 링크하는 것과 같은 작업을 수행하는 것이 좋습니다(참조여기).

여러 항목을 한 번만 압축해야 하고 해당 아카이브에 새 파일을 쓰기 위해 지속적인 액세스가 필요하지 않은 경우 압축하는 것이 가장 쉽습니다(7-zip 사용 가능). 요즘 대부분의 사람들의 드라이브에서는 압축되지 않는 파일 형식(예: 영화, 사진)이 공간의 대부분을 차지하고 있습니다.

관련 정보