AWK: Verschachtelte bedingte Teilmenge von Zeilen ohne Überschriften

Question 1

Hier ist ein 3-Pass-Ansatz mit awk:

FNR == 1 {
        fn++        # counter for File Number, starts at 1
}

fn == 1 {
        key[$1] = 1 # first file: store keys
}

fn == 2 && $2 == "KEY" && $3 in key {
        id[$1] = 1  # second file, first pass: store id's
}

fn == 3 && $1 in id # second file, 2nd pass: print rows

Angenommen, das Obige ist in gespeichert selectrows.awk, verwenden Sie es folgendermaßen:

awk -f selectrows.awk keys.txt features.txt features.txt

oder alles in einer Zeile:

awk 'FNR == 1 {f++}; f == 1 {k[$1]}; f == 2 && $2=="KEY" && $3 in k {i[$1]}; f == 3 && $1 in i' keys.txt features.txt features.txt

Answer

Hier ist ein 3-Pass-Ansatz mit awk:

FNR == 1 {
        fn++        # counter for File Number, starts at 1
}

fn == 1 {
        key[$1] = 1 # first file: store keys
}

fn == 2 && $2 == "KEY" && $3 in key {
        id[$1] = 1  # second file, first pass: store id's
}

fn == 3 && $1 in id # second file, 2nd pass: print rows

Angenommen, das Obige ist in gespeichert selectrows.awk, verwenden Sie es folgendermaßen:

awk -f selectrows.awk keys.txt features.txt features.txt

oder alles in einer Zeile:

awk 'FNR == 1 {f++}; f == 1 {k[$1]}; f == 2 && $2=="KEY" && $3 in k {i[$1]}; f == 3 && $1 in i' keys.txt features.txt features.txt

Question 2

Vorausgesetzt, Sie haben die Schlüssel-/Gruppenbeziehungen keysund Ihre Features in der Datei, featureserhalten Sie gemäß Ihrer Eingabe die folgenden erwarteten Ergebnisse:

awk '{print $2}' keys | sort -u | xargs -i_group awk '{if($2=="_group")print $1}' keys | sort -u | xargs -i_key awk '{if ($3=="_key" && $2=="KEY")print $1}' features | sort -u | xargs -i_id awk '{if($1=="_id")print $0}' features

Es handelt sich lediglich um eine Lösung, nicht unbedingt eine gute, vielleicht sogar die schlechteste in Bezug auf die Leistung, aber immerhin eine.

Answer

Vorausgesetzt, Sie haben die Schlüssel-/Gruppenbeziehungen keysund Ihre Features in der Datei, featureserhalten Sie gemäß Ihrer Eingabe die folgenden erwarteten Ergebnisse:

awk '{print $2}' keys | sort -u | xargs -i_group awk '{if($2=="_group")print $1}' keys | sort -u | xargs -i_key awk '{if ($3=="_key" && $2=="KEY")print $1}' features | sort -u | xargs -i_id awk '{if($1=="_id")print $0}' features

Es handelt sich lediglich um eine Lösung, nicht unbedingt eine gute, vielleicht sogar die schlechteste in Bezug auf die Leistung, aber immerhin eine.

Question 3

Ich habe diese kürzere Lösung gefunden:

grep -P "^\ +[`awk '$3==""{a[$1]=$2}; $2=="KEY" && $3 in a {printf "%s", $1}' \
<(cat keys features)`]" features

Es wird ein Befehl generiert, der wie folgt aussieht:

grep -P "^\ +[ABD]" features

...wobei der -Teil in der Mitte durch die Aussage ABDerfasst wirdawk

Answer

Ich habe diese kürzere Lösung gefunden:

grep -P "^\ +[`awk '$3==""{a[$1]=$2}; $2=="KEY" && $3 in a {printf "%s", $1}' \
<(cat keys features)`]" features

Es wird ein Befehl generiert, der wie folgt aussieht:

grep -P "^\ +[ABD]" features

...wobei der -Teil in der Mitte durch die Aussage ABDerfasst wirdawk

AWK: Verschachtelte bedingte Teilmenge von Zeilen ohne Überschriften

Antwort1

Antwort2

Antwort3

verwandte Informationen