TAR-Datei-Extraktion, warum die Dateigröße reduziert wurde

TAR-Datei-Extraktion, warum die Dateigröße reduziert wurde

Wir wissen allgemein, dass Komprimierung die Reduzierung der Datengröße ist, um Speicherplatz oder Übertragungszeit zu sparen. Ich muss mit einer größeren Größe rechnen, wenn ich komprimierte Dateien extrahiere. Ich habe eine Datei im Tar-Format (95 KB) heruntergeladen und als ich sie extrahiert habe, hat sich ihre Größe verringert (5,7 KB) und darunter gab es einige andere Dateien, die jetzt sogar 0 Byte groß sind. Was könnte der Grund dafür sein?

Antwort1

Das Tar-Format ist nicht komprimiert. Es fügt jedoch am Anfang jeder Datei oder jedes Verzeichnisses im Archiv Header hinzu. Die Header werden von Tar verwendet, um ihm den Namen der Datei, den Zeitstempel usw. mitzuteilen. Diese Informationen sind nicht Teil der Daten in der Datei, aber Tar benötigt sie, um die Datei neu zu erstellen. Jeder Header ist normalerweise 512 Bytes lang, kann aber größer sein, wenn der Dateiname länger als 100 Zeichen ist. Das Ende eines Tar-Archivs ist durch einen leeren Header gekennzeichnet. Diese Header erklären normalerweise etwaige Größenunterschiede zwischen dem Archiv und allem, was daraus extrahiert wurde.

Es könnte auch Unterschiede geben, die nicht durch die Größe der Tar-Header erklärt werden können, aber das sind meist Sonderfälle und schwer zu diagnostizieren, ohne die Tar-Datei oder zumindest eine Auflistung davon zu sehen. Eine mögliche Erklärung für einen großen Unterschied, eine riesige Tar-Datei, aus der aber nur sehr wenig extrahiert wurde, ist, wenn das Archiv viele Kopien derselben Datei enthält. Dies könnte passieren, wenn jemand am Ende immer wieder neuere Versionen hinzufügt, möglicherweise als Sicherungsstrategie. Die Tar-Extraktion würde einfach jedes Mal dieselbe Datei überschreiben, ohne mehr Speicherplatz zu verwenden.

verwandte Informationen