
Então eu tenho uma pasta antiga com muitas coisas. Acho que há arquivos duplicados aqui e ali.
Vale a pena fazer um backup do squashfs primeiro? Ou devo apenas 7zip?
Aqui está meu método de truque de backup:
apt install -y squashfs-tools ;
cd /mnt/BackupDrive
mksquashfs /mnt/OldSourceDrive/ Backup-Deduped.squashfs
-keep-as-directory
Responder1
A resposta anterior que afirma que o Squashfs não detecta duplicatas está incorreta. O Squashfs detecta explicitamente arquivos duplicados e armazena os dados apenas uma vez. Isso é anterior e totalmente separado da compactação.
Aliás, a saída do Mksquashfs informará quantos arquivos duplicados existem.
Você também altera o algoritmo de compactação padrão e o tamanho do bloco de gzip e 128K. Isso alcançará uma melhor compactação.
mksquashfs /mnt/OldSourceDrive/ Backup-Deduped.squashfs -keep-as-directory -comp xz -b 1M
Responder2
Você mencionou especificamente que possui arquivos duplicados, por isso vale ressaltar que, em geral, os formatos de compactação de sistema de arquivos ou de arquivo não removem a redundância entre arquivos duplicados. A exceção é tar.gz, mas mesmo assim não fará muita diferença no espaço ocupado pelos arquivos duplicados. Se arquivos duplicados são o principal motivo pelo qual você deseja compactar, seria melhor fazer algo como executar um localizador de arquivos duplicados sobre eles e remover ou vincular quaisquer duplicatas (consulteaqui).
Se você só precisa compactar um monte de coisas uma vez e não precisa de acesso contínuo para gravar novos arquivos nesse arquivo, é mais fácil simplesmente compactá-lo (você pode usar o 7-zip). Observe que hoje em dia, nas unidades da maioria das pessoas, a maior parte do espaço é ocupada por formatos de arquivo que não podem ser compactados (por exemplo, filmes, fotos).