Grep 兩個檔案並列印多次命中的行

Question 1

將的每個值保存file1.txt在陣列中a。然後，解析file2.txt並列印中同時具有第一個和第二個欄位的行a。

awk 'NR==FNR{a[$0];next}$1 in a && $2 in a' file1.txt file2.txt

對於中的任意數量的字段file2.txt，循環遍歷所有字段並執行檢查。如果其中一個欄位不在中a，則繼續下一行，否則列印該行。

awk 'NR==FNR{a[$0];next}{for(i=1;i<=NF;i++){if(!($i in a)){next}}print}' file1.txt file2.txt

Answer

將的每個值保存file1.txt在陣列中a。然後，解析file2.txt並列印中同時具有第一個和第二個欄位的行a。

awk 'NR==FNR{a[$0];next}$1 in a && $2 in a' file1.txt file2.txt

對於中的任意數量的字段file2.txt，循環遍歷所有字段並執行檢查。如果其中一個欄位不在中a，則繼續下一行，否則列印該行。

awk 'NR==FNR{a[$0];next}{for(i=1;i<=NF;i++){if(!($i in a)){next}}print}' file1.txt file2.txt

Question 2

使用我們可以透過建立一個包含的元素的python超集來接近 pbm 。bfile1.txt

然後，對於從中讀取的每一行，file2.txt我們檢查從目前行形成的集合是否是超集 b 的子集。在這種情況下，我們列印 file2.txt 的目前行`

$ python3 -c 'import sys
f1, f2 = sys.argv[1:]
with open(f1) as fh1, open(f2) as fh2:
  b = set([l.strip() for l in fh1])
  print(*(l.rstrip() for l in fh2 if set(l.strip().split()).issubset(b)), sep="\n")
' file1.txt file2.txt

abc ghi
mno jkl

$ perl -lane '$. == 1 and 
    %h = map { /(.*)(\n)/ } <STDIN>;
    print if ! grep { ! $h{$_} } @F;
' file2.txt < file1.txt

使用 sed，我們將 file1.txt 儲存在保留空間中，然後對於從 File2.txt 讀取的每一行，我們與當前行的所有元素的存在進行比較，並在找到所有元素時列印。

$ sed -Ee '
    /\n/{h;d;}
    /\s/!{H;d;}
    G;h
    s/\n.*//;s/\n//;x
    :a
      s/^\s?(\S+)((\s\S+)?\n.*\n\1(\n|$))/\2/
    ta
    s/^\n//;tb
    D;:b;x
' file1.txt file2.txt

while IFS= read -r l <&3; do
  read -r a b <<<"$l"
  grep -qFe "$a" file1.txt &&
  grep -qFe "$b" file1.txt &&
  printf '<%s>\n' "$l"
done 3< file2.txt

Answer

使用我們可以透過建立一個包含的元素的python超集來接近 pbm 。bfile1.txt

然後，對於從中讀取的每一行，file2.txt我們檢查從目前行形成的集合是否是超集 b 的子集。在這種情況下，我們列印 file2.txt 的目前行`

$ python3 -c 'import sys
f1, f2 = sys.argv[1:]
with open(f1) as fh1, open(f2) as fh2:
  b = set([l.strip() for l in fh1])
  print(*(l.rstrip() for l in fh2 if set(l.strip().split()).issubset(b)), sep="\n")
' file1.txt file2.txt

abc ghi
mno jkl

$ perl -lane '$. == 1 and 
    %h = map { /(.*)(\n)/ } <STDIN>;
    print if ! grep { ! $h{$_} } @F;
' file2.txt < file1.txt

使用 sed，我們將 file1.txt 儲存在保留空間中，然後對於從 File2.txt 讀取的每一行，我們與當前行的所有元素的存在進行比較，並在找到所有元素時列印。

$ sed -Ee '
    /\n/{h;d;}
    /\s/!{H;d;}
    G;h
    s/\n.*//;s/\n//;x
    :a
      s/^\s?(\S+)((\s\S+)?\n.*\n\1(\n|$))/\2/
    ta
    s/^\n//;tb
    D;:b;x
' file1.txt file2.txt

while IFS= read -r l <&3; do
  read -r a b <<<"$l"
  grep -qFe "$a" file1.txt &&
  grep -qFe "$b" file1.txt &&
  printf '<%s>\n' "$l"
done 3< file2.txt

Grep 兩個檔案並列印多次命中的行

答案1

答案2

相關內容