awk代碼解釋

Question

此程式碼片段的作用是輸出未壓縮內容中的行，freebase-rdf-latest.gz其第一個空格分隔欄位$1與中的任何第一個空格分隔欄位相符cvgMids.txt。不過還可以寫得更簡單。

尤其：

正如您所指出的，i沒有在任何地方使用，因此該BEGIN區塊可能會被消除
序列
```
if($1 in a) next;
a[$1] = $1;
next
```
可以減少到
```
a[$1];
next
```
（數組的價值觀從未使用過，僅使用其索引，幾乎可以肯定多次重新分配索引與測試和有條件分配它一樣有效）
在規則-行動中
```
FNR<NR {
    if($1 in a) {print $0;}}
```
你其實並不需要，FNR<NR因為你已經處理過這個案子FNR==NR並且FNR>NR不會發生¹。另外，{print $0;}這是預設操作。所以這樣寫會比較慣用
```
$1 in a 
```
<(cat cvgMids.txt)並且 <(gzip -dc freebase-rdf-latest.gz)是外殼流程替代。從功能上講，第一個相當於cvgMids.txt（它都是貓的無用用途以及無用的重定向）。也許它是出於美學原因而使用的。

把它們放在一起，我們得到

awk 'FNR == NR {a[$1]; next} $1 in a' cvgMids.txt <(gzip -dc freebase-rdf-latest.gz) > cvg_predicates.txt

但是，如果原始版本不起作用，那麼簡化版本也將不起作用。

¹除非你的程式碼修改FNR和/或NR- 這是合法的，但在實踐中很少這樣做。

Answer 1

此程式碼片段的作用是輸出未壓縮內容中的行，freebase-rdf-latest.gz其第一個空格分隔欄位$1與中的任何第一個空格分隔欄位相符cvgMids.txt。不過還可以寫得更簡單。

尤其：

正如您所指出的，i沒有在任何地方使用，因此該BEGIN區塊可能會被消除
序列
```
if($1 in a) next;
a[$1] = $1;
next
```
可以減少到
```
a[$1];
next
```
（數組的價值觀從未使用過，僅使用其索引，幾乎可以肯定多次重新分配索引與測試和有條件分配它一樣有效）
在規則-行動中
```
FNR<NR {
    if($1 in a) {print $0;}}
```
你其實並不需要，FNR<NR因為你已經處理過這個案子FNR==NR並且FNR>NR不會發生¹。另外，{print $0;}這是預設操作。所以這樣寫會比較慣用
```
$1 in a 
```
<(cat cvgMids.txt)並且 <(gzip -dc freebase-rdf-latest.gz)是外殼流程替代。從功能上講，第一個相當於cvgMids.txt（它都是貓的無用用途以及無用的重定向）。也許它是出於美學原因而使用的。

把它們放在一起，我們得到

awk 'FNR == NR {a[$1]; next} $1 in a' cvgMids.txt <(gzip -dc freebase-rdf-latest.gz) > cvg_predicates.txt

但是，如果原始版本不起作用，那麼簡化版本也將不起作用。

¹除非你的程式碼修改FNR和/或NR- 這是合法的，但在實踐中很少這樣做。

相關內容