Wie kann ich wiederholte Zeilen entfernen, indem ich nur den Text einer Spalte berücksichtige?

Question 1

Sie können den Feldtrenner von awk auf Leerzeichen oder setzen +und dann die klassische, auf assoziativen Arrays basierende Deduplizierung durchführen:

$ awk -F'[ \t+]' '!seen[$1]++' file
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

Sie können den Feldtrenner von awk auf Leerzeichen oder setzen +und dann die klassische, auf assoziativen Arrays basierende Deduplizierung durchführen:

$ awk -F'[ \t+]' '!seen[$1]++' file
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 2

Vielleicht habe ich das Problem falsch verstanden, aber das scheint zu funktionieren:

grep -v '+.' file

Ausgabe:

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

Vielleicht habe ich das Problem falsch verstanden, aber das scheint zu funktionieren:

grep -v '+.' file

Ausgabe:

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 3

Dasselbe habe ich mit seddem Befehl erreicht.

sed -n '/^.\{1,5\} .$/p' filename

Ausgabe

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

Dasselbe habe ich mit seddem Befehl erreicht.

sed -n '/^.\{1,5\} .$/p' filename

Ausgabe

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 4

Verwenden vonMüller:

mlr --tsv --implicit-csv-header --headerless-csv-output \
    put -S '$1=gsub($1,"[+].+$","")' then uniq -a inputfile

und die Ausgabe ist:

ICR1    +
IRT1    +
LSR1    -
NME1    +
PWR1    -
Q0017   -
Q0020   -

Answer

Verwenden vonMüller:

mlr --tsv --implicit-csv-header --headerless-csv-output \
    put -S '$1=gsub($1,"[+].+$","")' then uniq -a inputfile

und die Ausgabe ist:

ICR1    +
IRT1    +
LSR1    -
NME1    +
PWR1    -
Q0017   -
Q0020   -

Wie kann ich wiederholte Zeilen entfernen, indem ich nur den Text einer Spalte berücksichtige?

Antwort1

Antwort2

Antwort3

Antwort4

verwandte Informationen