¿La mejor compresión de archivos similares?

¿La mejor compresión de archivos similares?

Tengo algunas copias de seguridad antiguas completas de cosas como volcados de bases de datos binarias. Obviamente, no difieren mucho, por lo que realizar copias de seguridad completas no es la idea más inteligente en este caso. Por ahora estoy buscando un programa de compresión capaz de aprovechar el hecho de que la mayoría de los archivos tienen un contenido similar.

Respuesta1

Si primero tar los archivos (usando tar cvf my_backup.tar <file list...>), cualquier herramienta de compresión hará un buen trabajo ya que verá los datos como un archivo grande.

Así que simplemente tar los archivos y luego colocarlos en un zip, 7-zip, bzip2, etc. Desde el archivo tar, puede probar los diferentes algoritmos de compresión y ver cuál funciona mejor.

Respuesta2

He tenido muy buena suerte con 7-Zip. Si tiene los caballos de fuerza, es capaz de funcionar con una ventana muy grande. Asegúrese de que sus archivos originales estén lo más descomprimidos posible para que pueda encontrar similitudes. (Para archivos de Excel en un entorno heterogéneo, por ejemplo, esto significa descomprimir su contenido primero, ya que los archivos xlsx se comprimen ligeramente cuando se almacenan. Una vez pude comprimir más de 600 MiB de archivos de versión de Excel casi redundantes en unos pocos cien KiB.)

información relacionada