ZFS 解釋 zdb -S Tank 的輸出

Question

您應該查看此直方圖的兩件事。第一個也是最明顯的一個是dedup它結尾的表達式。沒有什麼好說的，因為它是簡單的數學。在您的情況下，重複資料刪除只會節省2% 的空間，而且由於您不使用壓縮（您應該先使用壓縮，因為它可以節省空間並為您提供效能，因為I/O 比CPU 時間成本更高）像 LZ4 這樣的高效演算法），這就是啟用重複資料刪除後您將獲得的邊際增益：2~3%。

當有效空間節省高於 2.0 並且您的儲存子系統非常昂貴，以至於可以浪費記憶體和 CPU 來處理重複資料刪除時，重複資料刪除就開始變得有價值。例如，我們正在討論企業 NVMe 池。

但這要付出什麼代價呢？

這是我提到的第二件事。第一個命中將在您的 RAM 中。您需要將重複資料刪除表儲存在 RAM 上。如果沒有 RAM 來容納它，系統就會崩潰，並且您將無法安裝該池。新版本的 ZFS（如 OpenZFS 2.0）有一些進步，但我不知道這方面是否有任何變化。

考慮到這一點，您只需獲得區塊的總數，即第一列的最後一行：49.6M

由於每個重複資料刪除表需要 320 字節，因此您只需將區塊數乘以給定重複資料刪除表所需的空間，即可獲得所需的 RAM 量：

49.6M * 320 bytes = 15.872MB ~ 15.5GB

所以你幾乎會浪費16 GB系統 RAM 只是為了對非重複資料刪除友善的資料進行重複資料刪除。這 16GB 將從系統的重要部分（例如 ARC）中刪除，這只會加速您的池。

所以不行。重複資料刪除不值得，除非：

您擁有極為昂貴的儲存子系統
您的資料可以輕鬆地進行重複資料刪除

Answer 1