AWK: subconjunto condicional aninhado de linhas sem cabeçalhos

Question 1

Aqui está uma abordagem de 3 passagens com o awk:

FNR == 1 {
        fn++        # counter for File Number, starts at 1
}

fn == 1 {
        key[$1] = 1 # first file: store keys
}

fn == 2 && $2 == "KEY" && $3 in key {
        id[$1] = 1  # second file, first pass: store id's
}

fn == 3 && $1 in id # second file, 2nd pass: print rows

Supondo que o texto acima esteja salvo em selectrows.awk, use-o assim:

awk -f selectrows.awk keys.txt features.txt features.txt

ou, tudo em uma linha:

awk 'FNR == 1 {f++}; f == 1 {k[$1]}; f == 2 && $2=="KEY" && $3 in k {i[$1]}; f == 3 && $1 in i' keys.txt features.txt features.txt

Answer

Aqui está uma abordagem de 3 passagens com o awk:

FNR == 1 {
        fn++        # counter for File Number, starts at 1
}

fn == 1 {
        key[$1] = 1 # first file: store keys
}

fn == 2 && $2 == "KEY" && $3 in key {
        id[$1] = 1  # second file, first pass: store id's
}

fn == 3 && $1 in id # second file, 2nd pass: print rows

Supondo que o texto acima esteja salvo em selectrows.awk, use-o assim:

awk -f selectrows.awk keys.txt features.txt features.txt

ou, tudo em uma linha:

awk 'FNR == 1 {f++}; f == 1 {k[$1]}; f == 2 && $2=="KEY" && $3 in k {i[$1]}; f == 3 && $1 in i' keys.txt features.txt features.txt

Question 2

Supondo que você tenha as relações chave/grupo no arquivo keyse seus recursos no arquivo, featuresos resultados abaixo serão esperados de acordo com a entrada fornecida:

awk '{print $2}' keys | sort -u | xargs -i_group awk '{if($2=="_group")print $1}' keys | sort -u | xargs -i_key awk '{if ($3=="_key" && $2=="KEY")print $1}' features | sort -u | xargs -i_id awk '{if($1=="_id")print $0}' features

É apenas uma solução, não necessariamente boa, talvez até a pior em termos de desempenho, mas ainda assim uma.

Answer

Supondo que você tenha as relações chave/grupo no arquivo keyse seus recursos no arquivo, featuresos resultados abaixo serão esperados de acordo com a entrada fornecida:

awk '{print $2}' keys | sort -u | xargs -i_group awk '{if($2=="_group")print $1}' keys | sort -u | xargs -i_key awk '{if ($3=="_key" && $2=="KEY")print $1}' features | sort -u | xargs -i_id awk '{if($1=="_id")print $0}' features

É apenas uma solução, não necessariamente boa, talvez até a pior em termos de desempenho, mas ainda assim uma.

Question 3

Encontrei esta solução mais curta:

grep -P "^\ +[`awk '$3==""{a[$1]=$2}; $2=="KEY" && $3 in a {printf "%s", $1}' \
<(cat keys features)`]" features

Ele gera um comando parecido com este:

grep -P "^\ +[ABD]" features

... onde a ABDparte do meio é reunida pela awkinstrução

Answer

Encontrei esta solução mais curta:

grep -P "^\ +[`awk '$3==""{a[$1]=$2}; $2=="KEY" && $3 in a {printf "%s", $1}' \
<(cat keys features)`]" features

Ele gera um comando parecido com este:

grep -P "^\ +[ABD]" features

... onde a ABDparte do meio é reunida pela awkinstrução

AWK: subconjunto condicional aninhado de linhas sem cabeçalhos

Responder1

Responder2

Responder3

informação relacionada