¿Cómo puedo eliminar líneas repetidas teniendo en cuenta el texto de solo una columna?

Question 1

Puede configurar el separador de campos de awk en espacios en blanco o +y luego realizar la clásica deduplicación basada en matrices asociativas:

$ awk -F'[ \t+]' '!seen[$1]++' file
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

Puede configurar el separador de campos de awk en espacios en blanco o +y luego realizar la clásica deduplicación basada en matrices asociativas:

$ awk -F'[ \t+]' '!seen[$1]++' file
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 2

Quizás no entendí bien el problema, pero esto parece funcionar:

grep -v '+.' file

Producción:

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

Quizás no entendí bien el problema, pero esto parece funcionar:

grep -v '+.' file

Producción:

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 3

He logrado lo mismo usando sedel comando

sed -n '/^.\{1,5\} .$/p' filename

producción

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

He logrado lo mismo usando sedel comando

sed -n '/^.\{1,5\} .$/p' filename

producción

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 4

mlr --tsv --implicit-csv-header --headerless-csv-output \
    put -S '$1=gsub($1,"[+].+$","")' then uniq -a inputfile

y la salida es:

ICR1    +
IRT1    +
LSR1    -
NME1    +
PWR1    -
Q0017   -
Q0020   -

Answer

mlr --tsv --implicit-csv-header --headerless-csv-output \
    put -S '$1=gsub($1,"[+].+$","")' then uniq -a inputfile

y la salida es:

ICR1    +
IRT1    +
LSR1    -
NME1    +
PWR1    -
Q0017   -
Q0020   -

información relacionada