AWK: Subconjunto condicional anidado de filas sin encabezados

Question 1

Aquí hay un enfoque de 3 pasos con awk:

FNR == 1 {
        fn++        # counter for File Number, starts at 1
}

fn == 1 {
        key[$1] = 1 # first file: store keys
}

fn == 2 && $2 == "KEY" && $3 in key {
        id[$1] = 1  # second file, first pass: store id's
}

fn == 3 && $1 in id # second file, 2nd pass: print rows

Suponiendo que lo anterior esté guardado en selectrows.awk, utilícelo así:

awk -f selectrows.awk keys.txt features.txt features.txt

o, todo en una línea:

awk 'FNR == 1 {f++}; f == 1 {k[$1]}; f == 2 && $2=="KEY" && $3 in k {i[$1]}; f == 3 && $1 in i' keys.txt features.txt features.txt

Answer

Aquí hay un enfoque de 3 pasos con awk:

FNR == 1 {
        fn++        # counter for File Number, starts at 1
}

fn == 1 {
        key[$1] = 1 # first file: store keys
}

fn == 2 && $2 == "KEY" && $3 in key {
        id[$1] = 1  # second file, first pass: store id's
}

fn == 3 && $1 in id # second file, 2nd pass: print rows

Suponiendo que lo anterior esté guardado en selectrows.awk, utilícelo así:

awk -f selectrows.awk keys.txt features.txt features.txt

o, todo en una línea:

awk 'FNR == 1 {f++}; f == 1 {k[$1]}; f == 2 && $2=="KEY" && $3 in k {i[$1]}; f == 3 && $1 in i' keys.txt features.txt features.txt

Question 2

Suponiendo que tiene las relaciones clave/grupo en el archivo keysy sus características en el archivo, featuresa continuación se obtienen los resultados esperados según la entrada que proporcionó:

awk '{print $2}' keys | sort -u | xargs -i_group awk '{if($2=="_group")print $1}' keys | sort -u | xargs -i_key awk '{if ($3=="_key" && $2=="KEY")print $1}' features | sort -u | xargs -i_id awk '{if($1=="_id")print $0}' features

Es solo una solución, no necesariamente buena, tal vez incluso la peor en cuanto a rendimiento, pero sigue siendo una.

Answer

Suponiendo que tiene las relaciones clave/grupo en el archivo keysy sus características en el archivo, featuresa continuación se obtienen los resultados esperados según la entrada que proporcionó:

awk '{print $2}' keys | sort -u | xargs -i_group awk '{if($2=="_group")print $1}' keys | sort -u | xargs -i_key awk '{if ($3=="_key" && $2=="KEY")print $1}' features | sort -u | xargs -i_id awk '{if($1=="_id")print $0}' features

Es solo una solución, no necesariamente buena, tal vez incluso la peor en cuanto a rendimiento, pero sigue siendo una.

Question 3

Encontré esta solución más corta:

grep -P "^\ +[`awk '$3==""{a[$1]=$2}; $2=="KEY" && $3 in a {printf "%s", $1}' \
<(cat keys features)`]" features

Genera un comando que se ve así:

grep -P "^\ +[ABD]" features

...donde la ABDparte -en el medio está reunida por la awkdeclaración

Answer

Encontré esta solución más corta:

grep -P "^\ +[`awk '$3==""{a[$1]=$2}; $2=="KEY" && $3 in a {printf "%s", $1}' \
<(cat keys features)`]" features

Genera un comando que se ve así:

grep -P "^\ +[ABD]" features

...donde la ABDparte -en el medio está reunida por la awkdeclaración

AWK: Subconjunto condicional anidado de filas sin encabezados

Respuesta1

Respuesta2

Respuesta3

información relacionada