bzip과 gzip의 장단점은 무엇입니까?

bzip과 gzip의 장단점은 무엇입니까?

저는 수년 동안 gzip을 알고 있었는데, 최근 직장에서 bzip이 사용되는 것을 보았습니다. 그들은 기본적으로 동일합니까, 아니면 둘 중 하나에 다른 것보다 중요한 장단점이 있습니까?

답변1

Gzip과 bzip2는 물론 xz와 lzop도 기능적으로 동일합니다. (한때 bzip이 있었지만 이제는 완전히 사라진 것 같습니다.) 다른 일반적인 압축 형식으로는 zip, rar 및 7z가 있습니다. 이 세 가지는 압축과 보관(여러 파일을 하나로 압축)을 모두 수행합니다. 다음은 속도, 가용성 및 일반적인 압축 비율 측면에서 몇 가지 일반적인 등급입니다(이러한 등급은 다소 주관적이므로 복음으로 받아들이지 마십시오).

decompression speed (fast > slow): lzop > gzip, zip > xz > 7z > rar > bzip2
compression speed (fast > slow): lzop > gzip, zip > xz > bzip2 > 7z > rar
compression ratio (better > worse): xz > 7z > rar, bzip2 > gzip > zip > lzop
availability (unix): gzip > bzip2 > xz > lzop > zip > 7z > rar
availability (windows): zip > rar > 7z > gzip > bzip2, lzop, xz

보시다시피 확실한 승자는 없습니다. 이미 설치되어 있을 가능성이 있는 프로그램을 사용하려면 Windows에서는 zip(또는 Windows에는 이러한 기능이 제공되지 않으므로 가능하면 자동 압축 풀기 아카이브)을 사용하고 Unix에서는 gzip을 사용하세요. 최대 압축을 원하면 7z 또는 xz를 사용하십시오.

Unix가 아닌 기본 형식(zip, rar, 7z)은 모든 Unix 메타데이터(소유권, 권한)를 보존하지 않습니다. 필요한 경우 압축 tar를 사용하십시오.

Rar에는 또한 내가 아는 한 rar 아카이브를 생성하거나 모든 rar 아카이브의 압축을 풀 수 있는 오픈 소스 소프트웨어가 없다는 단점이 있습니다. 다른 형식은 무료로 구현되며 (심각한) 특허 청구가 없습니다.

답변2

내가 알 수 있는 한, gzip은 전반적으로 더 빠른 반면, bzip은 전반적으로 더 나은(더 작은) 압축을 생성합니다.

답변3

알고리즘은 서로 다른 시간, 메모리, 공간 트레이드오프를 갖습니다. 이러한 알고리즘은 꽤 오래 전에 작성되었으며 스마트폰에는 당시 데스크톱보다 CPU가 몇 배나 더 많다는 점을 명심하세요.

보편성(.gz)과 좀 더 압축된 방식(.bz2) 사이에서 선택하세요. 오직 당신만이 당신이 어느 것에 더 관심을 가지고 있는지 말할 수 있습니다.

.gz의 한 가지 장점은 뒤를 볼 수 없는 시퀀스인 스트림을 압축할 수 있다는 것입니다. 이는 http 스트림의 공식 압축기가 됩니다. 그 때문에 gzip을 한 번 사용해야 했지만 그것에 대해 생각할 필요는 없을 것 같습니다.

답변4

http://tukaani.org/lzma/benchmarks.html, gzip은 bzip2보다 2배 빠르게 압축하고 10배 빠르게 압축을 푼다.

예를 들어 s3 캐싱, travis 등에서 작은 크기뿐만 아니라 압축/압축 해제 속도를 원하는 경우 gzip이 좋은 절충안이 될 수 있습니다.

관련 정보