Awk para fusionar dos archivos usando hash

Awk para fusionar dos archivos usando hash

Tengo dos archivos de la misma longitud y quiero intercambiar un archivo de 3 columnas con el contenido de otro archivo. Quiero imprimir lo siguiente:

f1Col1 f1Col2 f1Col3 f1Col4 f1Col5 f1Col6 f2Col1 f2Col2 f2Col3 f1Col10 f1Col11 f1Col12

¿Dónde f1Col1está la primera columna de file1, etc.?

Intenté usar lo siguiente:

awk 'NR==FNR {h1[$1] = $1; h2[$2] = $2; h3[$3] = $3; next} {print $1,$2,$3,$4,$5,$6,h1[$1],h2[$2],h3[$3],$10,$11,$12}' file2 file1

que imprime todas las columnas necesarias file1pero imprime espacios en blanco en lugar de las columnas de file2. ¿Qué pasa aquí?

(nota: estoy usando OS X Yosemite)

Respuesta1

Si file2contiene (por ejemplo)

The    quick    brown
fox    jumps    over
the    lazy     dog.

entonces la primera parte de tu awkscript está configurando

h1["The"]="The"
h2["quick"]="quick"
h3["brown"]="brown"
h1["fox"]="fox"
h2["jumps"]="jumps"
h3["over"]="over"
h1["the"]="the"
h2["lazy"]="lazy"
h3["dog."]="dog."

Esto no le sirve de nada cuando intenta utilizar esos valores guardados en la segunda parte del script; necesitas indexar las matrices por número de línea:

h1[1]="The"
h2[1]="quick"
h3[1]="brown"
h1[2]="fox"
h2[2]="jumps"
h3[2]="over"
h1[3]="the"
h2[3]="lazy"
h3[3]="dog."

Entonces tu guión debe ser

awk 'NR==FNR {h1[FNR] = $1; h2[FNR] = $2; h3[FNR] = $3; next}
{print $1,$2,$3,$4,$5,$6,h1[FNR],h2[FNR],h3[FNR],$10,$11,$12}' file2 file1

Respuesta2

Qué pasa:

paste <(awk'{ print $1,$2,$3,$4,$5,$6 }' file1) <(awk '{ print $1,$2,$3 }' file2) <(awk '{ print $10,$11,$12 }' file1) 
  • pegar toma información de los comandos awk individuales
  • al colocar los comandos awk entre '<()', solo se lee la salida estándar
  • pegar fusiona los tres archivos de salida fila por fila

información relacionada