скрипт оболочки для объединения 2 файлов на основе 2 столбцов и, если совпадение найдено, записи некоторых полей

Question

С использованием bash:

join -t @ -1 2 -2 2 -o2.1,1.2 -a 1 -e NULL \
    <( sort -t @ -k2 <( sed 's/,/@/' abc.csv ) ) \
    <( sort -t @ -k2 <( sed 's/,/@/' xyz.csv ) ) | sed 's/@/,/'

С двумя файлами

TBL_NAME,SANDBOX_NAME,SCRIPT_NAME
ccti_prod_attdnl_ext,abc_ext,101_ext_table.m_diag.pset
ccti_prod_attdnl_ext,abc_ids,101_ext_table.m_diag.pset
ccti_prod_attdnl_ext,xxx_ids,101_ext_table.m_diag.pset

( abc.csvиз вопроса, absзаменено на abcи добавлена несоответствующая строка) и

PID,SANDBOX_NAME,SCRIPT_NAME
11065,abc_ext,101_ext_table.m_diag.pset
11066,abc_ext,101_ext_table.m_diag.pset
11067,abc_ids,101_ext_table.m_diag.pset

( xyz.csvиз вопроса), это производит

PID,SANDBOX_NAME,SCRIPT_NAME
11065,abc_ext,101_ext_table.m_diag.pset
11066,abc_ext,101_ext_table.m_diag.pset
11067,abc_ids,101_ext_table.m_diag.pset
NULL,xxx_ids,101_ext_table.m_diag.pset

Работает joinс результатом замены первой запятой на @(любой символ, отсутствующий в данных, по крайней мере, не в первом поле) и сортирует каждый входной файл по второму @полю, разделенному запятыми (которое является последними двумя полями, разделенными запятыми). Он выводит первое поле из первого файла и второе поле из второго файла. Он также добавляет несовпадающие записи из первого файла и заменяет пустые поля строкой NULL.

Затем sedв конце заменяется @запятыми.

Answer 1