Imprimir columnas en awk por nombre de encabezado

Question 1

awk '
NR==1 {
    for (i=1; i<=NF; i++) {
        f[$i] = i
    }
}
{ print $(f["foo"]), $(f["baz"]) }
' file
foo baz
1 alpha
2 beta
3 gamma

Ése es un modismo inmensamente útil. Tengo muchos datos en hojas de cálculo y diferentes hojas de cálculo pueden tener un subconjunto común de columnas que me interesan, pero no necesariamente en el mismo orden en todas las hojas de cálculo o con el mismo número de otras columnas antes o entre ellas, para poder exportar. guardarlos como CSV o similar y luego simplemente ejecutar un script awk usando los nombres de las columnas en lugar de los números de las columnas es absolutamente invaluable.

Answer

awk '
NR==1 {
    for (i=1; i<=NF; i++) {
        f[$i] = i
    }
}
{ print $(f["foo"]), $(f["baz"]) }
' file
foo baz
1 alpha
2 beta
3 gamma

Ése es un modismo inmensamente útil. Tengo muchos datos en hojas de cálculo y diferentes hojas de cálculo pueden tener un subconjunto común de columnas que me interesan, pero no necesariamente en el mismo orden en todas las hojas de cálculo o con el mismo número de otras columnas antes o entre ellas, para poder exportar. guardarlos como CSV o similar y luego simplemente ejecutar un script awk usando los nombres de las columnas en lugar de los números de las columnas es absolutamente invaluable.

Question 2

Lo solicitas awk, pero también podrías utilizar una herramienta más especializada para esto: csvtool.

csvtool -t ' ' -u ' ' namedcol foo,baz file

o

csvtool -t ' ' -u ' ' col 1,3 file

Answer

Lo solicitas awk, pero también podrías utilizar una herramienta más especializada para esto: csvtool.

csvtool -t ' ' -u ' ' namedcol foo,baz file

o

csvtool -t ' ' -u ' ' col 1,3 file

Question 3

Suponiendo que el archivo es un archivo TSV ("valores separados por tabulaciones"), usecsvkit:

$ csvcut -t -c foo,baz file.tsv
foo,baz
1,alpha
2,beta
3,gamma

La salida tendrá el formato CSV adecuado, pero se puede volver a cambiar fácilmente a TSV:

$ csvcut -t -c foo,baz file.tsv | csvformat -T
foo     baz
1       alpha
2       beta
3       gamma

La -copción de csvcuttambién puede tomar números y rangos, y también puede usarse parareorganizarlas columnas de los datos de entrada (una característica que a menudo extraño en la cututilidad estándar).

Answer

Suponiendo que el archivo es un archivo TSV ("valores separados por tabulaciones"), usecsvkit:

$ csvcut -t -c foo,baz file.tsv
foo,baz
1,alpha
2,beta
3,gamma

La salida tendrá el formato CSV adecuado, pero se puede volver a cambiar fácilmente a TSV:

$ csvcut -t -c foo,baz file.tsv | csvformat -T
foo     baz
1       alpha
2       beta
3       gamma

La -copción de csvcuttambién puede tomar números y rangos, y también puede usarse parareorganizarlas columnas de los datos de entrada (una característica que a menudo extraño en la cututilidad estándar).

Imprimir columnas en awk por nombre de encabezado

Respuesta1

Respuesta2

Respuesta3

información relacionada