使用硬連結來精簡備份的最有效方法

Question 1

我看不到你如何使用參數這樣一點也不慢。我的線上幫助頁顯示 -P 是進程數，-n 是參數數。沒有特殊值-P0，因此可能會被忽略（或者，如果榮幸的話，您將獲得零個進程，這將解釋 24 小時什麼都沒有！）。並-n1確保您得到一個執行(2) 對於每個檔案名，這大約是最慢的。

我懷疑並行這項工作會為你帶來很多好處。我會想只是

$ echo filenames ... | xargs rm -rf

就足夠了。-P4如果你願意的話，你可以嘗試一些值。經過不是限制命令列參數的數量，可以最大限度地減少呼叫/bin/rm並讓它通過磁碟快取串行進行。

Answer

我看不到你如何使用參數這樣一點也不慢。我的線上幫助頁顯示 -P 是進程數，-n 是參數數。沒有特殊值-P0，因此可能會被忽略（或者，如果榮幸的話，您將獲得零個進程，這將解釋 24 小時什麼都沒有！）。並-n1確保您得到一個執行(2) 對於每個檔案名，這大約是最慢的。

我懷疑並行這項工作會為你帶來很多好處。我會想只是

$ echo filenames ... | xargs rm -rf

就足夠了。-P4如果你願意的話，你可以嘗試一些值。經過不是限制命令列參數的數量，可以最大限度地減少呼叫/bin/rm並讓它通過磁碟快取串行進行。

Question 2

df 報告的數字較小，因為您主要刪除相對較小的目錄。此外，根據檔案系統，對目錄的變更和對檔案連結數量的變更會立即記錄和/或同步到磁碟，因為它們對於故障復原至關重要，因此速度較慢。

這實際上證明了您的連結效率！

Answer

df 報告的數字較小，因為您主要刪除相對較小的目錄。此外，根據檔案系統，對目錄的變更和對檔案連結數量的變更會立即記錄和/或同步到磁碟，因為它們對於故障復原至關重要，因此速度較慢。

這實際上證明了您的連結效率！

Question 3

根據我的經驗，加速基於 rsync+hardlink 的備份的最佳方法是減少您擁有的檔案數量。

大量小檔案導致rsync變慢很多。

如果您可以以這樣的方式組織數據，以便您的大部分小文件、大部分只讀目錄變紅tar，您應該會看到備份腳本的速度顯著提高。（使用諸如之類的工具archivemount，您可以存取這些檔案而無需解壓縮它們）。

並行化備份腳本可能不會有幫助，甚至可能會減慢備份腳本的速度（可預測的磁碟存取更為最佳化）。

Answer

根據我的經驗，加速基於 rsync+hardlink 的備份的最佳方法是減少您擁有的檔案數量。

大量小檔案導致rsync變慢很多。

如果您可以以這樣的方式組織數據，以便您的大部分小文件、大部分只讀目錄變紅tar，您應該會看到備份腳本的速度顯著提高。（使用諸如之類的工具archivemount，您可以存取這些檔案而無需解壓縮它們）。

並行化備份腳本可能不會有幫助，甚至可能會減慢備份腳本的速度（可預測的磁碟存取更為最佳化）。

Question 4

這也是一種基於經驗的回應，而不是由硬數據支援的回應。

我發現，當刪除具有大量交叉連結的類似樹中的許多檔案時，並行刪除孤立的子樹似乎更快。讓我試著用圖來解釋：

topdir1
    |-a1
    |-b1
    |-c1

topdir2
    |-a2
    |-b2
    |-c2

topdir3
    |-a3
    |-b3
    |-c3

我的印像是，並行刪除, ,然後繼續刪除, , ，比並行刪除topdir1, topdir2,更快。（我對此的理論是，「相同」檔案的多個並行取消連結會導致 inode 連結引用計數的爭用，但我強調我還沒有用硬數據檢查這一點。）topdir3a1b1c1a2b2c2

for topdir in *
do
    echo "Removing $topdir..."
    for sub in "$topdir"/*; do rm -rf "$sub" & done
    wait
    rm -rf "$topdir"
done

Answer

這也是一種基於經驗的回應，而不是由硬數據支援的回應。

我發現，當刪除具有大量交叉連結的類似樹中的許多檔案時，並行刪除孤立的子樹似乎更快。讓我試著用圖來解釋：

topdir1
    |-a1
    |-b1
    |-c1

topdir2
    |-a2
    |-b2
    |-c2

topdir3
    |-a3
    |-b3
    |-c3

我的印像是，並行刪除, ,然後繼續刪除, , ，比並行刪除topdir1, topdir2,更快。（我對此的理論是，「相同」檔案的多個並行取消連結會導致 inode 連結引用計數的爭用，但我強調我還沒有用硬數據檢查這一點。）topdir3a1b1c1a2b2c2

for topdir in *
do
    echo "Removing $topdir..."
    for sub in "$topdir"/*; do rm -rf "$sub" & done
    wait
    rm -rf "$topdir"
done

相關內容