
Tengo un archivo grande (~20 GB) y quiero hacer rápidamente una estimación (aproximada) de qué tan bien se puede comprimir. Buscar un programa que pueda proporcionar una estimación inmediata del tamaño de archivo comprimido y posiblemente aumentar la precisión de la estimación cuanto más tiempo se deje para analizar los datos.
Respuesta1
Con la -v
opción gzip
se imprime la relación de compresión, por lo que, como estimación rápida y aproximada, podría hacer algo como esto:
$ dd if=myfile bs=1M count=100 2>/dev/null | gzip -v >/dev/null
80.5%
$
Por supuesto, aunque es rápido y sencillo, simplemente verificar la relación de compresión de los primeros x bytes (100 Mbytes en este ejemplo) podría ser muy engañoso si el contenido del archivo no es uniforme.
Por ejemplo, probablemente no sería bueno para una imagen de sistema de archivos.
Respuesta2
Sin examinar todos los datos, no hay forma de saber qué tan comprimibles son. Siéntete libre de mirarestepágina para obtener listas de herramientas y velocidades de compresión, pero lo que está pidiendo es básicamente imposible.