GREP 來自特定列的大寫字符，將結果透過管道傳輸到與新列相同的文件

Question 1

grep 中有沒有選項或參數來指定列？

grep沒有字段分隔符選項。
使用以下內容awk相反的方法：

awk -F'\t' -v OFS='\t' '{match($19,/[A-Z]+/); $20=substr($19,RSTART,RLENGTH) FS $20}1' 1.table

match($19,/[A-Z]+/)- 捕獲第 19 字段內的大寫字母

$20=substr($19,RSTART,RLENGTH) FS $20- 從中提取匹配的大寫字母19th 字段並將其插入為20第字段值

Answer

grep 中有沒有選項或參數來指定列？

grep沒有字段分隔符選項。
使用以下內容awk相反的方法：

awk -F'\t' -v OFS='\t' '{match($19,/[A-Z]+/); $20=substr($19,RSTART,RLENGTH) FS $20}1' 1.table

match($19,/[A-Z]+/)- 捕獲第 19 字段內的大寫字母

$20=substr($19,RSTART,RLENGTH) FS $20- 從中提取匹配的大寫字母19th 字段並將其插入為20第字段值

Question 2

回答你關於如何做到這一點的字面問題grep 獨自的。即使grep沒有為此設計，但使用 GNUgrep並使用 PCRE 支援構建，您可以這樣做：

grep -Po '(?:^(?:[^\t]*\t){18}|\G)[^\t]*?\K[[:upper:]]'

即搜尋<not-TABs><tab>行首或上一個符合項目末尾的 18 個序列 ( \G)，後面跟著盡可能少的非製表符（因此我們仍在第 19 個欄位），後面跟著大寫字母角色，但\K我們重置了匹配的大寫字元之前的部分。

所以對於這樣的輸入：

X<tab>X<tab>....<tab>AbC<tab>X<tab>...

它會報告：

A
C

就像你的cut | grep做法一樣。

如果您只對第 19 欄位中的第一個大寫字元感興趣，可以將其簡化為：

grep -Po '^(?:[^\t]*\t){18}[^\t]*?\K[[:upper:]]'

將其插入為第 20 個柱子，你可以這樣做：

paste <(cut -f1-19 < file) <(grep ...above < file) <(cut -f20- < file) > newfile

或將其插入為最後一列：

grep... < file | paste file - > newfile

Answer