如何壓縮僅包含少量資料的非常大的文件

如何壓縮僅包含少量資料的非常大的文件

我購買了 250 GB SSD,在其上運行完整格式,在其上安裝 Win10,使用克隆整個磁碟DD在 Linux 終端機中命令進行備份,以防我的 SSD 有時會損壞,所以現在我有一個大小約為的磁碟映像檔。 250 GB 看起來像這樣:

| --- some data (approx. 17 GB) --- | ------ no data at all, only nulls ------ |

我開始使用壓縮文件壓縮並期望壓縮會夠聰明給我一個約。 17 GB 大小,但經過幾個小時的壓縮和我的已經達到超過 50 GB,我中斷了該過程並來這裡詢問您是否還有其他潛在的方法可以做到這一點。

答案1

您確定磁碟機的空部分僅包含空值嗎?那裡可能有很多被刪除的垃圾。分發包上的內容無疑是壓縮儲存的。解壓縮安裝然後文件複製的到他們的目標,完成後所有臨時垃圾都會被刪除。因此,我希望找到的已刪除資料至少與安裝大小(交換文件佔用的空間)一樣大。

除此之外,當涉及高度可壓縮的資料時,我發現在非常糟糕的情況下壓縮存檔會進一步縮小它。大多數壓縮器都有字典項的最大長度,當檔案中的冗餘大大超過這個長度時(如果你的問題是你所認為的那樣),你最終會運行被壓縮的字典條目的程式碼。 (請注意,我還發現壓縮包含大量小檔案的檔案有一個小小的好處——檔案不再壓縮,但內務資料卻壓縮了。)

話雖如此,您在這裡需要做的是複製分割區,然後將複製的分割區縮小到盡可能小(如果可以的話,刪除您的交換和休眠檔案),然後對結果執行您所做的操作。

答案2

您不能假設磁碟上的任何空白空間僅包含 0 或完全一致的資料。刪除檔案不會自動將 0 寫入它所佔用的磁碟區域,它只是將指向該資料的任何指標標記為無效,並等待其他需要在該空間中寫入資料的東西。同時,任何數據在技術上仍然存在,但獲取起來更加困難。

您也不能假設新磁碟將被清除,資料很可能是來自製造和測試過程的完全隨機的垃圾。

如果您絕對必須以這種方式產生磁碟映像,那麼您需要先自己用一致的資料填入該空白空間。

在 Windows 上,您可以下載一個名為刪除它有一個選項可以正確地對磁碟進行零填充:sdelete -z

在較大的磁碟上,這將非常耗時,並且可能需要數小時甚至數天,具體取決於磁碟的大小。

更明智的選擇是使用了解磁碟格式的工具,並且僅儲存實際需要儲存的數據,並忽略磁碟上的「空白」空間。

  • 馬克里姆反射
  • 克隆屬
  • 安克諾斯 Trueimage

這些只是其中的一些,但還有更多的磁碟映像軟體。

相關內容