объединить строки на основе строки в 2 столбцах 2 файлов

Question

Используя GNU awkи GNU join, которые являются стандартными для Linux (могут работать или не работать с версиями, отличными от GNU):

$ join -a1 -1 3 -2 2 <(sort -k3,3 file1) <(sort -k2,2 file2) | 
    awk '$4 == "" { $4 = "-" }; {t=$1; $1=$2; $2=$3; $3=t; print}' |
    sort
300 100 a101 b60 uuuuuuuu 344
450 410 a400 -
670 710 a20 -
700 610 a340 b30 tttttttt 456

Команда joinобъединяет file1 и file2 по полям 3 и 2 соответственно. Она используетзамена процессадля обеспечения сортировки обоих файлов по соответствующим ключевым полям. Опция -a 1используется для того, чтобы все строки из file1были напечатаны, даже если они не совпадают со строкой из file2.

К сожалению, joinпомещает поле ключа file1 в начало каждой записи. Это исправлено с помощью awkперемещения полей обратно в их исходный порядок, используя переменную, называемую tвременным держателем для значения $1. Скрипт awk также добавляет завершающий символ тире в поле $4, если между файлами не было совпадений (потому что joinсам он этого не делает).

Наконец, вывод сортируется.

Answer 1

Используя GNU awkи GNU join, которые являются стандартными для Linux (могут работать или не работать с версиями, отличными от GNU):

$ join -a1 -1 3 -2 2 <(sort -k3,3 file1) <(sort -k2,2 file2) | 
    awk '$4 == "" { $4 = "-" }; {t=$1; $1=$2; $2=$3; $3=t; print}' |
    sort
300 100 a101 b60 uuuuuuuu 344
450 410 a400 -
670 710 a20 -
700 610 a340 b30 tttttttt 456

Команда joinобъединяет file1 и file2 по полям 3 и 2 соответственно. Она используетзамена процессадля обеспечения сортировки обоих файлов по соответствующим ключевым полям. Опция -a 1используется для того, чтобы все строки из file1были напечатаны, даже если они не совпадают со строкой из file2.

К сожалению, joinпомещает поле ключа file1 в начало каждой записи. Это исправлено с помощью awkперемещения полей обратно в их исходный порядок, используя переменную, называемую tвременным держателем для значения $1. Скрипт awk также добавляет завершающий символ тире в поле $4, если между файлами не было совпадений (потому что joinсам он этого не делает).

Наконец, вывод сортируется.

объединить строки на основе строки в 2 столбцах 2 файлов

решение1

Связанный контент