유사한 파일을 가장 잘 압축합니까?

유사한 파일을 가장 잘 압축합니까?

바이너리 데이터베이스 덤프와 같은 것들에 대한 몇 가지 완전한 오래된 백업이 있습니다. 분명히 크게 다르지 않으므로 전체 백업을 수행하는 것이 여기서 가장 현명한 아이디어는 아닙니다. 현재로서는 대부분의 파일이 유사한 내용을 가지고 있다는 사실을 활용할 수 있는 압축 프로그램을 찾고 있습니다.

답변1

먼저 파일을 tar하면(을 사용하여 tar cvf my_backup.tar <file list...>) 데이터를 하나의 큰 파일로 볼 수 있으므로 모든 압축 도구가 제대로 작동합니다.

따라서 파일을 tar로 압축한 다음 zip, 7-zip, bzip2 등에 넣으십시오. tar 파일에서 다양한 압축 알고리즘을 시도하고 어떤 것이 가장 성능이 좋은지 확인할 수 있습니다.

답변2

저는 7-Zip을 사용하여 매우 행운을 누렸습니다. 마력이 있다면 매우 큰 창을 가지고도 작동이 가능합니다. 유사점을 찾을 수 있도록 원본 파일을 최대한 압축하지 않도록 하세요. (예를 들어 이기종 환경의 Excel 파일의 경우 xlsx 파일은 저장 시 약간 압축되므로 먼저 내용의 압축을 푸는 것을 의미합니다. 한때 거의 중복된 Excel 버전 파일 600MiB 이상을 몇 개로 압축할 수 있었습니다. 100KiB.)

관련 정보