最初の列に基づいて2つのファイルを比較する

Question 1

$ awk 'NR==FNR{a[$1]; next} FNR==1 || !($1 in a)' file2 file1
ID      firstname        lastname
4       Brenda           Something

NR==FNR{a[$1]; next}最初の列を使用してfile2配列キーを構築します
- NRこれまでに読み込まれたレコードの総数を追跡し、FNR現在読み込まれているファイルに対してのみレコード番号を持ちます。したがって、NR==FNR最初のファイルに対してのみ当てはまります（空でない場合）。
FNR==1 || !($1 in a)ファイルの場合はfile1ヘッダー行を印刷するか、配列の最初の列が見つからない場合はa
awk -F'\t' '...'入力がタブ区切りの場合とawk -F, '...'カンマ区切りの場合に使用します。

最初のファイルが空でも構わない場合は、次のようにします。

awk '!f{a[$1]; next} FNR==1 || !($1 in a)' file2 f=1 file1

fこれにより、2 つのファイル間にフラグが設定されます。

Answer

$ awk 'NR==FNR{a[$1]; next} FNR==1 || !($1 in a)' file2 file1
ID      firstname        lastname
4       Brenda           Something

NR==FNR{a[$1]; next}最初の列を使用してfile2配列キーを構築します
- NRこれまでに読み込まれたレコードの総数を追跡し、FNR現在読み込まれているファイルに対してのみレコード番号を持ちます。したがって、NR==FNR最初のファイルに対してのみ当てはまります（空でない場合）。
FNR==1 || !($1 in a)ファイルの場合はfile1ヘッダー行を印刷するか、配列の最初の列が見つからない場合はa
awk -F'\t' '...'入力がタブ区切りの場合とawk -F, '...'カンマ区切りの場合に使用します。

最初のファイルが空でも構わない場合は、次のようにします。

awk '!f{a[$1]; next} FNR==1 || !($1 in a)' file2 f=1 file1

fこれにより、2 つのファイル間にフラグが設定されます。

Question 2

bash コマンドラインでは、次のように実行できます。file2 から ID をフィルタリングし、file1 でそれらの ID を検索しますが、行の先頭のみを検索します。

$ grep -vf <(< file2 tail -n+2 | grep -Eo '^[^ ]{1,}'|sed 's/.*/^& /') file1
ID      firstname        lastname
4       Brenda           Something

Answer

bash コマンドラインでは、次のように実行できます。file2 から ID をフィルタリングし、file1 でそれらの ID を検索しますが、行の先頭のみを検索します。

$ grep -vf <(< file2 tail -n+2 | grep -Eo '^[^ ]{1,}'|sed 's/.*/^& /') file1
ID      firstname        lastname
4       Brenda           Something

関連情報