列のテキストのみを考慮して重複行を削除するにはどうすればよいでしょうか?

Question 1

awk のフィールド区切り文字を空白またはに設定し+、古典的な連想配列ベースの重複排除を実行できます。

$ awk -F'[ \t+]' '!seen[$1]++' file
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

awk のフィールド区切り文字を空白またはに設定し+、古典的な連想配列ベースの重複排除を実行できます。

$ awk -F'[ \t+]' '!seen[$1]++' file
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 2

おそらく私は問題を誤解しているのでしょうが、これはうまくいくようです:

grep -v '+.' file

出力：

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

おそらく私は問題を誤解しているのでしょうが、これはうまくいくようです:

grep -v '+.' file

出力：

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 3

sedコマンドを使用して同じことを達成しました

sed -n '/^.\{1,5\} .$/p' filename

出力

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

sedコマンドを使用して同じことを達成しました

sed -n '/^.\{1,5\} .$/p' filename

出力

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 4

mlr --tsv --implicit-csv-header --headerless-csv-output \
    put -S '$1=gsub($1,"[+].+$","")' then uniq -a inputfile

出力は次のようになります。

ICR1    +
IRT1    +
LSR1    -
NME1    +
PWR1    -
Q0017   -
Q0020   -

Answer

mlr --tsv --implicit-csv-header --headerless-csv-output \
    put -S '$1=gsub($1,"[+].+$","")' then uniq -a inputfile

出力は次のようになります。

ICR1    +
IRT1    +
LSR1    -
NME1    +
PWR1    -
Q0017   -
Q0020   -

関連情報