script de shell para unir 2 archivos en base a 2 columnas y, si se encuentra una coincidencia, escriba algunos campos

Question

Usando bash:

join -t @ -1 2 -2 2 -o2.1,1.2 -a 1 -e NULL \
    <( sort -t @ -k2 <( sed 's/,/@/' abc.csv ) ) \
    <( sort -t @ -k2 <( sed 's/,/@/' xyz.csv ) ) | sed 's/@/,/'

Con los dos archivos

TBL_NAME,SANDBOX_NAME,SCRIPT_NAME
ccti_prod_attdnl_ext,abc_ext,101_ext_table.m_diag.pset
ccti_prod_attdnl_ext,abc_ids,101_ext_table.m_diag.pset
ccti_prod_attdnl_ext,xxx_ids,101_ext_table.m_diag.pset

( abc.csvde la pregunta, absreemplazado por abcy agregada una línea que no coincide) y

PID,SANDBOX_NAME,SCRIPT_NAME
11065,abc_ext,101_ext_table.m_diag.pset
11066,abc_ext,101_ext_table.m_diag.pset
11067,abc_ids,101_ext_table.m_diag.pset

( xyz.csvde la pregunta), esto produce

PID,SANDBOX_NAME,SCRIPT_NAME
11065,abc_ext,101_ext_table.m_diag.pset
11066,abc_ext,101_ext_table.m_diag.pset
11067,abc_ids,101_ext_table.m_diag.pset
NULL,xxx_ids,101_ext_table.m_diag.pset

Opera joinsobre el resultado de reemplazar la primera coma por @(cualquier carácter que no esté presente en los datos, al menos no en el primer campo) y ordenar cada archivo de entrada en el segundo @campo delimitado (que son los dos últimos campos separados por comas). . Genera el primer campo del primer archivo y el segundo campo del segundo archivo. También agrega las entradas no coincidentes del primer archivo y reemplaza los campos vacíos con la cadena NULL.

El sedal final luego reemplaza @con comas.

Answer 1