
나는 큰 파일(~20GB)을 가지고 있으며 파일이 얼마나 잘 압축될 수 있는지에 대한 (대략적인) 추정치를 빠르게 만들고 싶습니다. 압축된 파일 크기를 즉시 추측할 수 있는 프로그램을 검색하고 데이터 분석 시간이 길어질수록 추정의 정확도가 높아질 수 있습니다.
답변1
-v
옵션을 사용하면 gzip
압축 비율을 인쇄하므로 빠르고 간단한 추정으로 다음과 같은 작업을 수행할 수 있습니다.
$ dd if=myfile bs=1M count=100 2>/dev/null | gzip -v >/dev/null
80.5%
$
물론, 빠르고 간단하기는 하지만 파일 내용이 균일하지 않으면 처음 x바이트(이 예에서는 100MB)의 압축 비율을 확인하는 것만으로도 매우 오해를 불러일으킬 수 있습니다.
예를 들어 파일 시스템 이미지에는 적합하지 않을 수 있습니다.
답변2
모든 데이터를 조사하지 않으면 해당 데이터의 압축 가능성을 알 수 없습니다. 편하게 구경해보세요이것페이지에 압축 도구 및 속도 목록이 있지만 귀하가 요구하는 것은 기본적으로 불가능합니다.