如何使用 grep 處理檔案中的模式並取得每個模式出現的次數？

Question 1

如果patterns檔案僅包含固定字串，則在gnu設定中您可以執行下列操作

grep -oFf patterns infile | sort | uniq -c

如果內容是正規表示式那麼可能是這樣的

sed -E 'h;s|/|\\&|g;x;s|[\&/]|\\&|g;H;x;s|(.*)\n(.*)|s/\1/\2/|' patterns \
| sed -f - <(grep -of patterns infile)  | sort | uniq -c

即grep僅這次使用相同的命令處理結果，sed以便將匹配項替換為實際模式（透過sed基於內容的另一個腳本patterns）

Answer

如果patterns檔案僅包含固定字串，則在gnu設定中您可以執行下列操作

grep -oFf patterns infile | sort | uniq -c

如果內容是正規表示式那麼可能是這樣的

sed -E 'h;s|/|\\&|g;x;s|[\&/]|\\&|g;H;x;s|(.*)\n(.*)|s/\1/\2/|' patterns \
| sed -f - <(grep -of patterns infile)  | sort | uniq -c

即grep僅這次使用相同的命令處理結果，sed以便將匹配項替換為實際模式（透過sed基於內容的另一個腳本patterns）

Question 2

uniq 有一個選項來計算出現次數

grep -f fileA.txt fileB.txt | uniq -c

但請記住，如果 fileA 中有重複項，計數將不正確，因為它會多次 grep 查找它們。在這種情況下，首先透過 uniq 執行 fileA 以刪除重複項，然後將其用於模式。

您可以將其過濾到一個新文件中，或者逐行處理該文件並從中運行。

while read keyword; do grep $keyword fileB.txt; done < fileA.txt | uniq -c

Answer

uniq 有一個選項來計算出現次數

grep -f fileA.txt fileB.txt | uniq -c

但請記住，如果 fileA 中有重複項，計數將不正確，因為它會多次 grep 查找它們。在這種情況下，首先透過 uniq 執行 fileA 以刪除重複項，然後將其用於模式。

您可以將其過濾到一個新文件中，或者逐行處理該文件並從中運行。

while read keyword; do grep $keyword fileB.txt; done < fileA.txt | uniq -c

相關內容