給定 3 個文字文件，如何從每個文件中找到唯一行

Question 1

假設：

文字檔案每行有一個 ID
每行只包含一個 ID，沒有其他文本
文件中的 ID 不重複
可以對輸出檔案重新排序（對其進行排序）
執行效率並不重要
ID 是字母數字

$ cat A B B C C | sort | uniq -u >A.uniq
$ cat B A A C C | sort | uniq -u >B.uniq
$ cat C A A B B | sort | uniq -u >C.uniq
$ mv A.uniq A
$ mv B.uniq B
$ mv C.uniq C

“cat”指令將列出的檔案連接在一起。第一個檔案是我想要刪除重複項的檔案。接下來的文件是我想要刪除的潛在重複文件。我添加了每個文件的兩個副本，以確保它們是重複的並且將被刪除。

接下來，我按字母順序將這些文件「排序」在一起。這會導致任何重複的 ID 出現在排序輸出中的相鄰行上。

帶有“-u”選項的“uniq”命令僅輸出 uniq 的行。如果輸入中的相鄰行出現兩個或多個相同的 ID，則不會輸出任何內容。

'>' 將輸出寫入名為 'A.uniq' 的新文件

如果您想執行相反的操作並產生 3 個文件中重複的所有 ID 的列表，您可以執行以下操作：

$ cat A B C | sort | uniq -d >duplicates

帶有“-d”標誌的“uniq”命令僅在輸入中重複兩次或多次時才輸出一行。

Answer

假設：

文字檔案每行有一個 ID
每行只包含一個 ID，沒有其他文本
文件中的 ID 不重複
可以對輸出檔案重新排序（對其進行排序）
執行效率並不重要
ID 是字母數字

$ cat A B B C C | sort | uniq -u >A.uniq
$ cat B A A C C | sort | uniq -u >B.uniq
$ cat C A A B B | sort | uniq -u >C.uniq
$ mv A.uniq A
$ mv B.uniq B
$ mv C.uniq C