如何評估是否值得使用重複資料刪除?

如何評估是否值得使用重複資料刪除?

我有一個分割區正在考慮使用重複資料刪除。

對於其數據的配置文件,我認為這將是一個不錯的選擇。不過,在做之前,我想以比「感覺」更有系統的方式評估影響。

是否有工具可以評估重複資料刪除對分割區的影響? (檔案層級或區塊層級)。

目前我有 ubuntu 和 ext4,但如果重複資料刪除在這種情況下被證明是有價值的,我正在考慮使用 opendedup 或 lessfs。任何其他建議,即使這可能意味著使用不同的發行版/免費 *nix。

答案1

您沒有指定哪個檔案系統。如果您談論的是 ZFS,您可以使用 zdb 命令來查看開啟 dedup 會產生什麼效果:

# zdb -S tank
Simulated DDT histogram:

bucket              allocated                       referenced          
______   ______________________________   ______________________________
refcnt   blocks   LSIZE   PSIZE   DSIZE   blocks   LSIZE   PSIZE   DSIZE
------   ------   -----   -----   -----   ------   -----   -----   -----
     1      775   96.8M   96.8M   96.8M      775   96.8M   96.8M   96.8M
     2        2    256K    256K    256K        6    768K    768K    768K
     4        3    384K    384K    384K       13   1.62M   1.62M   1.62M
   128        1    128K    128K    128K      158   19.8M   19.8M   19.8M
 Total      781   97.5M   97.5M   97.5M      952    119M    119M    119M

dedup = 1.22, compress = 1.00, copies = 1.00, dedup * compress / copies = 1.22

相關內容