Eliminar duplicados en un archivo

Question 1

Asumiendoque el archivo debe tener el formato

field1\n
field2\n
\n
field1\n
field2\n
\n

es decir, la última línea del archivo de muestra debería decir

Mysteriosa                  Mysteriosa

entonces esto debería funcionar, siempre que haya una nueva línea \nal final de la última entrada

sed '$!N;$!N;s/\n/:/g' file | nl -s"|" | sort -t '|' -k2 | awk -F"|" '!_[$2]++' | sort -n | sed -e 's/.*|//' -e 's/:/\n/g'

Answer

Asumiendoque el archivo debe tener el formato

field1\n
field2\n
\n
field1\n
field2\n
\n

es decir, la última línea del archivo de muestra debería decir

Mysteriosa                  Mysteriosa

entonces esto debería funcionar, siempre que haya una nueva línea \nal final de la última entrada

sed '$!N;$!N;s/\n/:/g' file | nl -s"|" | sort -t '|' -k2 | awk -F"|" '!_[$2]++' | sort -n | sed -e 's/.*|//' -e 's/:/\n/g'

Question 2

Dominio:

awk '{if (!seen[$1,$2]++)print $0}' filename

Answer

Dominio:

awk '{if (!seen[$1,$2]++)print $0}' filename

información relacionada