Mesclando dois arquivos de texto usando AWK

Question

awk '!second { file1vals[$1 FS $2]=$0 }
      second { print (($1 FS $2 in file1vals)?file1vals[$1 FS $2]: $1 FS $2 FS "0 0 0 0") FS $3, $4, $5, $6;
               delete file1vals[$1 FS $2]
             }
END{ for(x in file1vals) print file1vals[x], "0 0 0 0" }' file1 second=1 file2

isso funcionará enquanto houver memória suficiente para carregar o primeiroarquivo1na memória.

No primeiro bloco !second {...}, que só roda quando é o primeiro arquivo e carregamos oarquivo1em uma matriz associada no par de 1ª ^e 2ª ^colunas como as chaves da matriz.

No segundo bloco second {...}, que só é executado quando for o segundo arquivo, imprimimos as linhas unidas aquelas que possuem chaves correspondentes em ambos os arquivos, caso contrário, imprimimos as chaves e 0s seguidos pelo restante das colunas dearquivo2; então também excluímos as chaves do array com delete file1vals[$1 FS $2]as quais suas chaves existiam em ambos os arquivos.

No último bloco no END, imprimimos as chaves não correspondentes restantes relacionadas aarquivo1.

Answer 1

awk '!second { file1vals[$1 FS $2]=$0 }
      second { print (($1 FS $2 in file1vals)?file1vals[$1 FS $2]: $1 FS $2 FS "0 0 0 0") FS $3, $4, $5, $6;
               delete file1vals[$1 FS $2]
             }
END{ for(x in file1vals) print file1vals[x], "0 0 0 0" }' file1 second=1 file2

isso funcionará enquanto houver memória suficiente para carregar o primeiroarquivo1na memória.

No primeiro bloco !second {...}, que só roda quando é o primeiro arquivo e carregamos oarquivo1em uma matriz associada no par de 1ª ^e 2ª ^colunas como as chaves da matriz.

No segundo bloco second {...}, que só é executado quando for o segundo arquivo, imprimimos as linhas unidas aquelas que possuem chaves correspondentes em ambos os arquivos, caso contrário, imprimimos as chaves e 0s seguidos pelo restante das colunas dearquivo2; então também excluímos as chaves do array com delete file1vals[$1 FS $2]as quais suas chaves existiam em ambos os arquivos.

No último bloco no END, imprimimos as chaves não correspondentes restantes relacionadas aarquivo1.

Mesclando dois arquivos de texto usando AWK

Responder1

informação relacionada