我有一個分割區正在考慮使用重複資料刪除。
對於其數據的配置文件,我認為這將是一個不錯的選擇。不過,在做之前,我想以比「感覺」更有系統的方式評估影響。
是否有工具可以評估重複資料刪除對分割區的影響? (檔案層級或區塊層級)。
目前我有 ubuntu 和 ext4,但如果重複資料刪除在這種情況下被證明是有價值的,我正在考慮使用 opendedup 或 lessfs。任何其他建議,即使這可能意味著使用不同的發行版/免費 *nix。
答案1
您沒有指定哪個檔案系統。如果您談論的是 ZFS,您可以使用 zdb 命令來查看開啟 dedup 會產生什麼效果:
# zdb -S tank
Simulated DDT histogram:
bucket allocated referenced
______ ______________________________ ______________________________
refcnt blocks LSIZE PSIZE DSIZE blocks LSIZE PSIZE DSIZE
------ ------ ----- ----- ----- ------ ----- ----- -----
1 775 96.8M 96.8M 96.8M 775 96.8M 96.8M 96.8M
2 2 256K 256K 256K 6 768K 768K 768K
4 3 384K 384K 384K 13 1.62M 1.62M 1.62M
128 1 128K 128K 128K 158 19.8M 19.8M 19.8M
Total 781 97.5M 97.5M 97.5M 952 119M 119M 119M
dedup = 1.22, compress = 1.00, copies = 1.00, dedup * compress / copies = 1.22