AWK: ヘッダーのない行のネストされた条件付きサブセット

Question 1

以下は awk を使用した 3 パスのアプローチです。

FNR == 1 {
        fn++        # counter for File Number, starts at 1
}

fn == 1 {
        key[$1] = 1 # first file: store keys
}

fn == 2 && $2 == "KEY" && $3 in key {
        id[$1] = 1  # second file, first pass: store id's
}

fn == 3 && $1 in id # second file, 2nd pass: print rows

上記がに保存されていると仮定するとselectrows.awk、次のように使用します。

awk -f selectrows.awk keys.txt features.txt features.txt

または、すべてを 1 行に記述します。

awk 'FNR == 1 {f++}; f == 1 {k[$1]}; f == 2 && $2=="KEY" && $3 in k {i[$1]}; f == 3 && $1 in i' keys.txt features.txt features.txt

Answer

以下は awk を使用した 3 パスのアプローチです。

FNR == 1 {
        fn++        # counter for File Number, starts at 1
}

fn == 1 {
        key[$1] = 1 # first file: store keys
}

fn == 2 && $2 == "KEY" && $3 in key {
        id[$1] = 1  # second file, first pass: store id's
}

fn == 3 && $1 in id # second file, 2nd pass: print rows

上記がに保存されていると仮定するとselectrows.awk、次のように使用します。

awk -f selectrows.awk keys.txt features.txt features.txt

または、すべてを 1 行に記述します。

awk 'FNR == 1 {f++}; f == 1 {k[$1]}; f == 2 && $2=="KEY" && $3 in k {i[$1]}; f == 3 && $1 in i' keys.txt features.txt features.txt

Question 2

ファイルにキー/グループの関係がありkeys、ファイルに機能があると仮定するとfeatures、以下は入力に応じて期待される結果を取得します。

awk '{print $2}' keys | sort -u | xargs -i_group awk '{if($2=="_group")print $1}' keys | sort -u | xargs -i_key awk '{if ($3=="_key" && $2=="KEY")print $1}' features | sort -u | xargs -i_id awk '{if($1=="_id")print $0}' features

これは単なる解決策であり、必ずしも良い解決策ではなく、パフォーマンスの点では最悪の解決策である可能性もありますが、それでも解決策の 1 つです。

Answer

ファイルにキー/グループの関係がありkeys、ファイルに機能があると仮定するとfeatures、以下は入力に応じて期待される結果を取得します。

awk '{print $2}' keys | sort -u | xargs -i_group awk '{if($2=="_group")print $1}' keys | sort -u | xargs -i_key awk '{if ($3=="_key" && $2=="KEY")print $1}' features | sort -u | xargs -i_id awk '{if($1=="_id")print $0}' features

これは単なる解決策であり、必ずしも良い解決策ではなく、パフォーマンスの点では最悪の解決策である可能性もありますが、それでも解決策の 1 つです。

Question 3

私は次のような短い解決策を見つけました:

grep -P "^\ +[`awk '$3==""{a[$1]=$2}; $2=="KEY" && $3 in a {printf "%s", $1}' \
<(cat keys features)`]" features

次のようなコマンドが生成されます。

grep -P "^\ +[ABD]" features

...ABD真ん中の-部分は、次のawk文でまとめられます

Answer

私は次のような短い解決策を見つけました:

grep -P "^\ +[`awk '$3==""{a[$1]=$2}; $2=="KEY" && $3 in a {printf "%s", $1}' \
<(cat keys features)`]" features

次のようなコマンドが生成されます。

grep -P "^\ +[ABD]" features

...ABD真ん中の-部分は、次のawk文でまとめられます

AWK: ヘッダーのない行のネストされた条件付きサブセット

答え1

答え2

答え3

関連情報