據我所知,rsync 工具中的演算法將對檔案進行切片並為每個切片計算一個雜湊值。因此,我假設有些文件的哈希演算法將重建文件,而無需實際傳輸較少的資料。我想只有零的文件將是一個很好的候選者,對吧?
答案1
rsync 演算法比這更複雜。為遠端檔案計算檔案切片的雜湊值並將其傳輸到本機 rsync。本機 rsync 使用這些雜湊值在本機檔案中任何出現的地方尋找符合的檔案部分。這些匹配的部分不會被傳輸;相反,會發送告訴遠端 rsync 如何重現這些部分的令牌,這就是 rsync 避免傳輸整個檔案的方式。
因此,rsync 的最佳文件是那些具有大量共同資料的文件,可能會透過插入和刪除進行移動,例如由典型的人類編輯活動產生的文件類型。這並不奇怪,因為正如 rsync 作者 Andrew Tridgell 在他的書中所寫的那樣博士論文,他開始考慮 rsync 演算法,同時不耐煩地等待程式原始檔透過數據機連結更新。