如何只考慮一列中的文字來刪除重複的行？

Question 1

您可以將 awk 的欄位分隔符號設為空格或+，然後執行經典的基於關聯數組的重複資料刪除：

$ awk -F'[ \t+]' '!seen[$1]++' file
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

您可以將 awk 的欄位分隔符號設為空格或+，然後執行經典的基於關聯數組的重複資料刪除：

$ awk -F'[ \t+]' '!seen[$1]++' file
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 2

也許我誤解了這個問題，但這似乎有效：

grep -v '+.' file

輸出：

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

也許我誤解了這個問題，但這似乎有效：

grep -v '+.' file

輸出：

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 3

我透過使用sed命令實現了相同的目標

sed -n '/^.\{1,5\} .$/p' filename

輸出

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

我透過使用sed命令實現了相同的目標

sed -n '/^.\{1,5\} .$/p' filename

輸出

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 4

mlr --tsv --implicit-csv-header --headerless-csv-output \
    put -S '$1=gsub($1,"[+].+$","")' then uniq -a inputfile

輸出是：

ICR1    +
IRT1    +
LSR1    -
NME1    +
PWR1    -
Q0017   -
Q0020   -

Answer

mlr --tsv --implicit-csv-header --headerless-csv-output \
    put -S '$1=gsub($1,"[+].+$","")' then uniq -a inputfile

輸出是：

ICR1    +
IRT1    +
LSR1    -
NME1    +
PWR1    -
Q0017   -
Q0020   -

相關內容