열의 텍스트를 고려하여 반복되는 줄을 제거하려면 어떻게 해야 합니까?

Question 1

awk의 필드 구분 기호를 공백 또는 로 설정한 +다음 고전적인 연관 배열 기반 중복 제거를 수행할 수 있습니다.

$ awk -F'[ \t+]' '!seen[$1]++' file
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

awk의 필드 구분 기호를 공백 또는 로 설정한 +다음 고전적인 연관 배열 기반 중복 제거를 수행할 수 있습니다.

$ awk -F'[ \t+]' '!seen[$1]++' file
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 2

어쩌면 내가 문제를 오해했을 수도 있지만 다음과 같이 작동하는 것 같습니다.

grep -v '+.' file

산출:

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

어쩌면 내가 문제를 오해했을 수도 있지만 다음과 같이 작동하는 것 같습니다.

grep -v '+.' file

산출:

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 3

sed나는 명령을 사용하여 동일한 결과를 얻었습니다.

sed -n '/^.\{1,5\} .$/p' filename

산출

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

sed나는 명령을 사용하여 동일한 결과를 얻었습니다.

sed -n '/^.\{1,5\} .$/p' filename

산출

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 4

사용밀러:

mlr --tsv --implicit-csv-header --headerless-csv-output \
    put -S '$1=gsub($1,"[+].+$","")' then uniq -a inputfile

출력은 다음과 같습니다.

ICR1    +
IRT1    +
LSR1    -
NME1    +
PWR1    -
Q0017   -
Q0020   -

Answer

사용밀러:

mlr --tsv --implicit-csv-header --headerless-csv-output \
    put -S '$1=gsub($1,"[+].+$","")' then uniq -a inputfile

출력은 다음과 같습니다.

ICR1    +
IRT1    +
LSR1    -
NME1    +
PWR1    -
Q0017   -
Q0020   -

관련 정보