刪除檔案中的重複項

Question 1

假設該文件的格式是

field1\n
field2\n
\n
field1\n
field2\n
\n

即範例文件中的最後一行應為

Mysteriosa                  Mysteriosa

那麼這應該可以解決問題，前提是\n最後一個條目後面有一個尾隨換行符

sed '$!N;$!N;s/\n/:/g' file | nl -s"|" | sort -t '|' -k2 | awk -F"|" '!_[$2]++' | sort -n | sed -e 's/.*|//' -e 's/:/\n/g'

Answer

假設該文件的格式是

field1\n
field2\n
\n
field1\n
field2\n
\n

即範例文件中的最後一行應為

Mysteriosa                  Mysteriosa

那麼這應該可以解決問題，前提是\n最後一個條目後面有一個尾隨換行符

sed '$!N;$!N;s/\n/:/g' file | nl -s"|" | sort -t '|' -k2 | awk -F"|" '!_[$2]++' | sort -n | sed -e 's/.*|//' -e 's/:/\n/g'

Question 2

命令：

awk '{if (!seen[$1,$2]++)print $0}' filename

Answer

命令：

awk '{if (!seen[$1,$2]++)print $0}' filename

相關內容