¿Squashfs para hacer una copia de seguridad? ¿O tar.gz? (Tengo todo tipo de basura que he guardado en mi vieja PC con duplicados probablemente... ¿vale la pena squashfs?

¿Squashfs para hacer una copia de seguridad? ¿O tar.gz? (Tengo todo tipo de basura que he guardado en mi vieja PC con duplicados probablemente... ¿vale la pena squashfs?

Entonces tengo una carpeta vieja con muchas cosas. Creo que hay archivos duplicados aquí y allá.

¿Vale la pena hacer primero una copia de seguridad de squashfs? ¿O debería simplemente comprimirlo?

Aquí está mi método de truco de respaldo:

apt install -y squashfs-tools ; 
cd /mnt/BackupDrive
mksquashfs /mnt/OldSourceDrive/ Backup-Deduped.squashfs
-keep-as-directory

Respuesta1

La respuesta anterior que indica que Squashfs no realiza detección de duplicados es incorrecta. Squashfs detecta explícitamente archivos duplicados y solo almacena los datos una vez. Esto es anterior y completamente independiente de la compresión.

Por cierto, la salida de Mksquashfs le dirá cuántos archivos duplicados hay.

También cambia el algoritmo de compresión predeterminado y el tamaño de bloque de gzip y 128K. Esto logrará una mejor compresión.

mksquashfs /mnt/OldSourceDrive/ Backup-Deduped.squashfs -keep-as-directory -comp xz -b 1M

Respuesta2

Mencionó específicamente que tiene archivos duplicados, por lo que vale la pena señalar que, en general, los formatos de compresión de archivos o sistemas de archivos no eliminarán la redundancia entre archivos duplicados. La excepción es tar.gz, pero aun así no supondrá una gran diferencia en el espacio que ocupan los archivos duplicados. Si los archivos duplicados son la razón principal por la que desea comprimirlos, sería mejor hacer algo como ejecutar un buscador de archivos duplicados sobre ellos y eliminar o vincular los duplicados (consulteaquí).

Si solo necesita comprimir un montón de cosas una vez y no necesita acceso continuo para escribir nuevos archivos en ese archivo, es más fácil simplemente comprimirlo (puede usar 7-zip). Tenga en cuenta que en los discos de la mayoría de las personas hoy en día la mayor parte del espacio lo ocupan formatos de archivos que no se comprimen (por ejemplo, películas, fotos).

información relacionada