dd と gzip で作成されたイメージファイルのサイズが正しくありませんか?

Question 1

これは圧縮の性質です。圧縮の有効性は入力データによって異なります。毎回異なるデータを圧縮するため、圧縮前のサイズは同じでも、圧縮後のサイズは異なります。

Answer

これは圧縮の性質です。圧縮の有効性は入力データによって異なります。毎回異なるデータを圧縮するため、圧縮前のサイズは同じでも、圧縮後のサイズは異なります。

Question 2

空き領域の方が圧縮率が高いとお考えのようですが、そのようなルールはありません。

一般的なファイルシステムは、空き領域を空きとしてマークするだけで、ゼロなどで上書きすることはありません。古いデータは、新しいデータで上書きされるまでそのまま残ります。(補足: これが、削除されたファイルを回復できる場合がある理由です)。

ddすべてを読み取りますが、ファイルシステムや、ファイルシステムが空き領域と見なすものについては何も知りません。次に、gzip圧縮率の良し悪しが問われる「空き領域」内の古いデータを含め、すべてを圧縮します。このコンテキストでは空き領域はなく、処理するデータストリームのみがあります。

空き領域としてマークされた古い「圧縮率の低い」データが、新しい「圧縮率の高い」ファイルに置き換えられた可能性があります。その場合、新しいアーカイブには、有用であると考えられる実際のデータや既存のデータがより多く含まれているにもかかわらず、新しいアーカイブは古いアーカイブよりも小さくなります。これが、発生した問題の主な原因である可能性があります。

参照してくださいハードディスクから使用中の領域のみをクローンする、そして私の答えは「準備」ステップでは、空きスペースをゼロで上書きするため、圧縮率が非常に高くなります。各バックアップの前にこれを実行した場合、結果として得られるアーカイブのサイズは、おそらく直感どおりになるはずです。

「おそらく」、なぜならあなたの質問に対するもう一つの答え一般的には正しいです。すべては入力データに依存します。空き領域をゼロにした後でも、60% 使用されているファイルシステムは、内部のファイルが異なる場合、50% 使用されている同じ大きさのファイルシステムよりも小さいアーカイブに圧縮される可能性があります。

Answer