ファイル内の重複を削除する

Question 1

仮定するとファイルが次の形式であることを意図している

field1\n
field2\n
\n
field1\n
field2\n
\n

つまり、サンプルファイルの最後の行は次のようになります。

Mysteriosa                  Mysteriosa

\n最後のエントリの後に改行があれば、これでうまくいくはずです。

sed '$!N;$!N;s/\n/:/g' file | nl -s"|" | sort -t '|' -k2 | awk -F"|" '!_[$2]++' | sort -n | sed -e 's/.*|//' -e 's/:/\n/g'

Answer

仮定するとファイルが次の形式であることを意図している

field1\n
field2\n
\n
field1\n
field2\n
\n

つまり、サンプルファイルの最後の行は次のようになります。

Mysteriosa                  Mysteriosa

\n最後のエントリの後に改行があれば、これでうまくいくはずです。

sed '$!N;$!N;s/\n/:/g' file | nl -s"|" | sort -t '|' -k2 | awk -F"|" '!_[$2]++' | sort -n | sed -e 's/.*|//' -e 's/:/\n/g'

Question 2

指示：

awk '{if (!seen[$1,$2]++)print $0}' filename

Answer

指示：

awk '{if (!seen[$1,$2]++)print $0}' filename

関連情報