
У меня большой файл (~20 ГБ), и я хочу быстро сделать (приблизительную) оценку того, насколько хорошо он может сжиматься. Поиск программы, которая может предоставить немедленное предположение о размере сжатого файла, и, возможно, повысить точность оценки, чем дольше остается анализ данных.
решение1
С помощью этой -v
опции gzip
можно вывести коэффициент сжатия, поэтому для быстрой и приблизительной оценки можно сделать что-то вроде этого:
$ dd if=myfile bs=1M count=100 2>/dev/null | gzip -v >/dev/null
80.5%
$
Конечно, хотя это и быстро и просто, простая проверка степени сжатия первых x байтов (100 Мбайт в этом примере) может быть очень обманчивой, если содержимое файла не является однородным.
Например, это, вероятно, не будет хорошо для образа файловой системы.
решение2
Не просеивая все данные, невозможно узнать, насколько они сжимаемы. Не стесняйтесь смотретьэтотстраницу со списками инструментов сжатия и скоростей, но то, о чем вы просите, в принципе невозможно.