從兩個目錄中提取相同的文件

Question 1

假設您的檔案名稱沒有任何空格，且任一目錄中都沒有子目錄，則下列命令會列印具有符合 MD5 和的檔案名稱對：

join -o 1.2,2.2 <(md5sum $D1/* | sort) <(md5sum $D2/* | sort)

若要僅取得其中一個檔案名，請使用-o 1.2或-o 2.2。

如果檔案名稱（或路徑）可能包含空格，則您需要更加聰明。

如果目錄可能有多個名稱的相同文件，那麼您還需要更加聰明——並且需要準確地決定要做什麼。一種可能性是在進行連接之前過濾掉重複項：

join -o 1.2,2.2 <(md5sum $D1/* | sort | uniq -w16) \
                <(md5sum $D2/* | sort | uniq -w16)

不使用sum

sum輸出16位元校驗和；如果每個目錄中有數百個文件，則在比較 16 位元校驗和時很可能會得到誤報。md5sum也不是絕對安全，但與 128 位元校驗和發生衝突的可能性很小。如有疑問，並且如果確實很重要，cmp您也可以查看這些文件：

join -o 1.2,2.2 <(md5sum $D1/* | sort) <(md5sum $D2/* | sort) |
while read F1 F2; do
  if cmp -s $F1 $F2; then
    cp F1 $D3
  fi
done

（同樣，如果檔案名稱中可能包含空格，則這將無法運作。）

Answer