Сравнить два файла по первому столбцу

Question 1

$ awk 'NR==FNR{a[$1]; next} FNR==1 || !($1 in a)' file2 file1
ID      firstname        lastname
4       Brenda           Something

NR==FNR{a[$1]; next}Использовать первый столбец file2для построения ключей массива
- NRотслеживает общее количество прочитанных записей, FNRимеет номер записи только для текущего читаемого файла. Таким образом, NR==FNRэто верно только для первого файла (при условии, что он не пустой)
FNR==1 || !($1 in a)для file1файла, вывести строку заголовка или если первый столбец не найден в массивеa
Используйте awk -F'\t' '...', если вводимые данные разделены табуляцией и awk -F, '...'запятыми.

Если первый файл может быть пустым, используйте это:

awk '!f{a[$1]; next} FNR==1 || !($1 in a)' file2 f=1 file1

Это установит флаг fмежду двумя файлами.

Answer

$ awk 'NR==FNR{a[$1]; next} FNR==1 || !($1 in a)' file2 file1
ID      firstname        lastname
4       Brenda           Something

NR==FNR{a[$1]; next}Использовать первый столбец file2для построения ключей массива
- NRотслеживает общее количество прочитанных записей, FNRимеет номер записи только для текущего читаемого файла. Таким образом, NR==FNRэто верно только для первого файла (при условии, что он не пустой)
FNR==1 || !($1 in a)для file1файла, вывести строку заголовка или если первый столбец не найден в массивеa
Используйте awk -F'\t' '...', если вводимые данные разделены табуляцией и awk -F, '...'запятыми.

Если первый файл может быть пустым, используйте это:

awk '!f{a[$1]; next} FNR==1 || !($1 in a)' file2 f=1 file1

Это установит флаг fмежду двумя файлами.

Question 2

В командной строке bash вы можете сделать следующее. Отфильтровать идентификаторы из file2 и поискать их в file1, но только в начале строки:

$ grep -vf <(< file2 tail -n+2 | grep -Eo '^[^ ]{1,}'|sed 's/.*/^& /') file1
ID      firstname        lastname
4       Brenda           Something

Answer

В командной строке bash вы можете сделать следующее. Отфильтровать идентификаторы из file2 и поискать их в file1, но только в начале строки:

$ grep -vf <(< file2 tail -n+2 | grep -Eo '^[^ ]{1,}'|sed 's/.*/^& /') file1
ID      firstname        lastname
4       Brenda           Something

Связанный контент