Compare dois arquivos, se as colunas forem iguais, substitua a próxima coluna por algum valor

Compare dois arquivos, se as colunas forem iguais, substitua a próxima coluna por algum valor

Como substituo um valor de coluna em um arquivo quando comparado com outro arquivo?

Eu tenho dois arquivosteste1.csveteste2.csv; Preciso substituir a empdepcoluna emteste1.csvse tiver o valor como"sinal*". O segundo arquivoteste2.csvtem o valor necessário para substituir isso"sinal*".

Nota: estou usando ksheteste1.csvtem cerca de 2.048.576 linhas eteste2.csvtem 10.000 linhas.

teste1.csv

empname,place,empdep
aaaa,city1,001
bbbb,city2,sign-1
dddd,city1,005
ffff,city5,sign-2
hhhh,city7,sign-1

teste2.csv

empname,new
aaaa,001
bbbb,002
cccc,003
dddd,005
eeee,006
ffff,007
gggg,008
hhhh,009

Resultado esperado:

empname,place,empdep
aaaa,city1,001
bbbb,city2,002
dddd,city1,005
ffff,city5,007
hhhh,city7,009

Responder1

Com awk:

awk '
  BEGIN{ FS=OFS="," } # set input/output field separator to `,`
  NR==FNR{            # if this is the first file `test2.csv`
    a[$1]=$2          # store field2 in array `a` using field1 as index
    next              # continue with next line
  } 
  $3 ~ /^sign/{       # if field3 of `test1.csv` begins with `sign`
    $3=a[$1]          # replace the field with array value (index of field1)
  }
  1                   # print the line
' test2.csv test1.csv

Responder2

Esta é uma maneira simples:

for i in $(cat text1.csv)  
do  
    name=$(echo $i | cut -d',' -f1)   
    empdep=$(echo $i | cut -d',' -f3)  
    newvalue=$(grep $name text2.csv | cut -d',' -f2)    
    if [[ $empdep = sign* ]]    
    then  
        sed -n "s/^$name,\(.*\),.*/$name,\1,$newvalue/pg" text1.csv  
    else  
        echo $i  
    fi  
done

Responder3

Usando kshe sed. Use sedpara analisarteste2.csve povoar ummatriz associativa ${new[@]}. Em seguida, percorrateste1.csvE usesubstituição de padrãopara imprimir as saídas desejadas:

typeset -A new $(sed -n '2,${s/^/new[/;s/,/]=/p}' test2.csv)
while IFS=, read a b c; do echo $a,$b,${c/#sign*/${new[$a]}}; done < test1.csv

Saída:

empname,place,empdep
aaaa,city1,001
bbbb,city2,002
dddd,city1,005
ffff,city5,007
hhhh,city7,009

Nota: Neste caso, os arquivos de entrada não possuem aspas e o código é visualmente mais simples sem aspas. Se qualquer arquivo de entrada contiver (ou puder conter) espaços, as variáveis ​​acimadeveser citado.

Responder4

csv-merge -N t1 -p test1.csv -N t2 -p test2.csv | 
csv-sqlite -T 'select t1.empname, t1.place, case when t1.empdep like "sign%" then t2.new else t1.empdep end as empdep
from t1 left join t2 on t1.empname = t2.empname'

csv-merge e csv-sqlite são dehttps://github.com/mslusarz/csv-nix-tools

informação relacionada