Remover duplicatas em um arquivo

Question 1

Supondoque o arquivo deve estar no formato

field1\n
field2\n
\n
field1\n
field2\n
\n

ou seja, a última linha do arquivo de amostra deve ser lida

Mysteriosa                  Mysteriosa

então isso deve funcionar, desde que haja uma nova linha final \napós a última entrada

sed '$!N;$!N;s/\n/:/g' file | nl -s"|" | sort -t '|' -k2 | awk -F"|" '!_[$2]++' | sort -n | sed -e 's/.*|//' -e 's/:/\n/g'

Answer

Supondoque o arquivo deve estar no formato

field1\n
field2\n
\n
field1\n
field2\n
\n

ou seja, a última linha do arquivo de amostra deve ser lida

Mysteriosa                  Mysteriosa

então isso deve funcionar, desde que haja uma nova linha final \napós a última entrada

sed '$!N;$!N;s/\n/:/g' file | nl -s"|" | sort -t '|' -k2 | awk -F"|" '!_[$2]++' | sort -n | sed -e 's/.*|//' -e 's/:/\n/g'

Question 2

Comando:

awk '{if (!seen[$1,$2]++)print $0}' filename

Answer

Comando:

awk '{if (!seen[$1,$2]++)print $0}' filename

informação relacionada