Compare dois arquivos com base na primeira coluna

Question 1

$ awk 'NR==FNR{a[$1]; next} FNR==1 || !($1 in a)' file2 file1
ID      firstname        lastname
4       Brenda           Something

NR==FNR{a[$1]; next}Use a primeira coluna de file2para construir chaves de array
- NRmantém registros do número total de registros lidos até o momento, FNRpossui o número do registro apenas para o arquivo atual que está sendo lido. Assim, NR==FNRé verdade apenas para o primeiro arquivo (assumindo que não esteja vazio)
FNR==1 || !($1 in a)para file1arquivo, imprima a linha do cabeçalho ou se a primeira coluna não for encontrada no arraya
Use awk -F'\t' '...'se sua entrada estiver separada por tabulação e awk -F, '...'por vírgula.

Se o primeiro arquivo puder estar vazio, use isto:

awk '!f{a[$1]; next} FNR==1 || !($1 in a)' file2 f=1 file1

Isso definirá um sinalizador fentre os dois arquivos.

Answer

$ awk 'NR==FNR{a[$1]; next} FNR==1 || !($1 in a)' file2 file1
ID      firstname        lastname
4       Brenda           Something

NR==FNR{a[$1]; next}Use a primeira coluna de file2para construir chaves de array
- NRmantém registros do número total de registros lidos até o momento, FNRpossui o número do registro apenas para o arquivo atual que está sendo lido. Assim, NR==FNRé verdade apenas para o primeiro arquivo (assumindo que não esteja vazio)
FNR==1 || !($1 in a)para file1arquivo, imprima a linha do cabeçalho ou se a primeira coluna não for encontrada no arraya
Use awk -F'\t' '...'se sua entrada estiver separada por tabulação e awk -F, '...'por vírgula.

Se o primeiro arquivo puder estar vazio, use isto:

awk '!f{a[$1]; next} FNR==1 || !($1 in a)' file2 f=1 file1

Isso definirá um sinalizador fentre os dois arquivos.

Question 2

Em uma linha de comando bash, você pode fazer o seguinte. Filtre os IDs do arquivo2 e procure-os no arquivo1, mas apenas no início da linha:

$ grep -vf <(< file2 tail -n+2 | grep -Eo '^[^ ]{1,}'|sed 's/.*/^& /') file1
ID      firstname        lastname
4       Brenda           Something

Answer

Em uma linha de comando bash, você pode fazer o seguinte. Filtre os IDs do arquivo2 e procure-os no arquivo1, mas apenas no início da linha:

$ grep -vf <(< file2 tail -n+2 | grep -Eo '^[^ ]{1,}'|sed 's/.*/^& /') file1
ID      firstname        lastname
4       Brenda           Something

informação relacionada