Compara dos archivos según la primera columna

Question 1

$ awk 'NR==FNR{a[$1]; next} FNR==1 || !($1 in a)' file2 file1
ID      firstname        lastname
4       Brenda           Something

NR==FNR{a[$1]; next}Utilice la primera columna file2para crear claves de matriz
- NRmantiene un seguimiento del número total de registros leídos hasta el momento, FNRtiene el número de registro solo para el archivo actual que se está leyendo. Por lo tanto, NR==FNRes cierto sólo para el primer archivo (suponiendo que no esté vacío)
FNR==1 || !($1 in a)para file1el archivo, imprima la línea del encabezado o si la primera columna no se encuentra en la matriza
Úselo awk -F'\t' '...'si su entrada está separada por tabulaciones y awk -F, '...'si está separada por comas.

Si el primer archivo puede estar vacío, use esto:

awk '!f{a[$1]; next} FNR==1 || !($1 in a)' file2 f=1 file1

Esto establecerá una bandera fentre los dos archivos.

Answer

$ awk 'NR==FNR{a[$1]; next} FNR==1 || !($1 in a)' file2 file1
ID      firstname        lastname
4       Brenda           Something

NR==FNR{a[$1]; next}Utilice la primera columna file2para crear claves de matriz
- NRmantiene un seguimiento del número total de registros leídos hasta el momento, FNRtiene el número de registro solo para el archivo actual que se está leyendo. Por lo tanto, NR==FNRes cierto sólo para el primer archivo (suponiendo que no esté vacío)
FNR==1 || !($1 in a)para file1el archivo, imprima la línea del encabezado o si la primera columna no se encuentra en la matriza
Úselo awk -F'\t' '...'si su entrada está separada por tabulaciones y awk -F, '...'si está separada por comas.

Si el primer archivo puede estar vacío, use esto:

awk '!f{a[$1]; next} FNR==1 || !($1 in a)' file2 f=1 file1

Esto establecerá una bandera fentre los dos archivos.

Question 2

En una línea de comando bash puedes hacer lo siguiente. Filtre los ID del archivo 2 y búsquelos en el archivo 1, pero solo al comienzo de la línea:

$ grep -vf <(< file2 tail -n+2 | grep -Eo '^[^ ]{1,}'|sed 's/.*/^& /') file1
ID      firstname        lastname
4       Brenda           Something

Answer

En una línea de comando bash puedes hacer lo siguiente. Filtre los ID del archivo 2 y búsquelos en el archivo 1, pero solo al comienzo de la línea:

$ grep -vf <(< file2 tail -n+2 | grep -Eo '^[^ ]{1,}'|sed 's/.*/^& /') file1
ID      firstname        lastname
4       Brenda           Something

información relacionada