如果第一列重複，則刪除檔案中的整行

Question 1

幾個方法：

awk
```
awk '!a[$1]++' file
```
這是一種非常簡潔的寫法：
```
awk '{if(! a[$1]){print; a[$1]++}}' file
```
因此，如果目前第一個欄位 ( $1) 不在a陣列中，則列印該行並將第一個欄位新增至a。下次我們看到該欄位時，它將位於數組中，因此不會被列印。
珀爾
```
perl -ane '$k{$F[0]}++ or print' file
```
或者
```
perl -ane 'print if !$k{$F[0]}++' file
```
這個和上一個基本上是一樣的awk。這-n導致 perl 逐行讀取輸入檔並將提供的腳本應用-e到每一行。將-a自動在空白處分割每一行並將結果欄位儲存在@F陣列中。最後，將第一個欄位新增至%k哈希中，如果尚不存在，則列印該行。同樣的事情可以寫成
```
perl -e 'while(<>){
            @F=split(/\s+/); 
            print unless defined($k{$F[0]}); 
            $k{$F[0]}++;
         }' file
```
核心工具
```
rev file | uniq -f 1 | rev
```
此方法的工作原理是首先反轉行，這樣如果行是 12 345，那麼現在file將是 543 21 uniq -f 1。此處file使用的uniq效果是過濾掉任何重複的行，每行僅保留 1 個。最後，我們透過另一個相反的操作將線條恢復到原來的順序。
GNU 排序（如建議作者：@StéphaneChazelas）
```
sort -buk1,1
```
此-b標誌忽略前導空格，且此-u方法僅列印唯一欄位。聰明的一點是-k1,1.此-k標誌設定要排序的欄位。它採用通用格式，即排序時-k POS1[,POS2]只透過POS2查看字段。POS1所以，-k1,1意味著只看第一個字段。根據您的數據，您可能還想添加以下選項之一：
```
 -g, --general-numeric-sort
      compare according to general numerical value
 -n, --numeric-sort
      compare according to string numerical value
```

Answer

幾個方法：

awk
```
awk '!a[$1]++' file
```
這是一種非常簡潔的寫法：
```
awk '{if(! a[$1]){print; a[$1]++}}' file
```
因此，如果目前第一個欄位 ( $1) 不在a陣列中，則列印該行並將第一個欄位新增至a。下次我們看到該欄位時，它將位於數組中，因此不會被列印。
珀爾
```
perl -ane '$k{$F[0]}++ or print' file
```
或者
```
perl -ane 'print if !$k{$F[0]}++' file
```
這個和上一個基本上是一樣的awk。這-n導致 perl 逐行讀取輸入檔並將提供的腳本應用-e到每一行。將-a自動在空白處分割每一行並將結果欄位儲存在@F陣列中。最後，將第一個欄位新增至%k哈希中，如果尚不存在，則列印該行。同樣的事情可以寫成
```
perl -e 'while(<>){
            @F=split(/\s+/); 
            print unless defined($k{$F[0]}); 
            $k{$F[0]}++;
         }' file
```
核心工具
```
rev file | uniq -f 1 | rev
```
此方法的工作原理是首先反轉行，這樣如果行是 12 345，那麼現在file將是 543 21 uniq -f 1。此處file使用的uniq效果是過濾掉任何重複的行，每行僅保留 1 個。最後，我們透過另一個相反的操作將線條恢復到原來的順序。
GNU 排序（如建議作者：@StéphaneChazelas）
```
sort -buk1,1
```
此-b標誌忽略前導空格，且此-u方法僅列印唯一欄位。聰明的一點是-k1,1.此-k標誌設定要排序的欄位。它採用通用格式，即排序時-k POS1[,POS2]只透過POS2查看字段。POS1所以，-k1,1意味著只看第一個字段。根據您的數據，您可能還想添加以下選項之一：
```
 -g, --general-numeric-sort
      compare according to general numerical value
 -n, --numeric-sort
      compare according to string numerical value
```

Question 2

如果第一列始終為 5 個字元長，您可以簡單地使用uniq：

uniq -w 5 file

如果沒有，請使用awk：

awk '$1!=a{print $0; a=$1}' file

對於大文件，第一個肯定會更快。

Answer

如果第一列始終為 5 個字元長，您可以簡單地使用uniq：

uniq -w 5 file

如果沒有，請使用awk：

awk '$1!=a{print $0; a=$1}' file

對於大文件，第一個肯定會更快。

如果第一列重複，則刪除檔案中的整行

答案1

答案2

相關內容