AWK: Передача переменных оболочки в awk

Question 1

Вам следует написать:

-v group="$TOKEN"

вместо -v group = $TOKEN, что приводит к синтаксической ошибке в awk.

Answer

Вам следует написать:

-v group="$TOKEN"

вместо -v group = $TOKEN, что приводит к синтаксической ошибке в awk.

Question 2

Похоже, вы хотите:

awk -F, '
  BEGIN {
    for (i = 1; i < ARGC; i++) group[ARGV[i]]
    ARGC=0
  }
  NR >= 2 && $2 in group' "$@" < infile

Или, если вы действительно хотите рассматривать аргументы как регулярные выражения для сопоставления со вторым столбцом:

awk -F, '
  BEGIN {
    for (i = 1; i < ARGC; i++) group[ARGV[i]]
    ARGC=0
  }
  NR >= 2 {
    for (i in group) if ($2 ~ i) {print; next}
  }' "$@" < infile

Answer

Похоже, вы хотите:

awk -F, '
  BEGIN {
    for (i = 1; i < ARGC; i++) group[ARGV[i]]
    ARGC=0
  }
  NR >= 2 && $2 in group' "$@" < infile

Или, если вы действительно хотите рассматривать аргументы как регулярные выражения для сопоставления со вторым столбцом:

awk -F, '
  BEGIN {
    for (i = 1; i < ARGC; i++) group[ARGV[i]]
    ARGC=0
  }
  NR >= 2 {
    for (i in group) if ($2 ~ i) {print; next}
  }' "$@" < infile

Question 3

Ваша непосредственная проблема — пробелы вокруг знака равенства. Аргументом опции -vдолжно быть присваивание. Awk видит аргумент -v, за которым следует скрипт ( =), за которым следуют имена файлов (значение TOKEN, ваш скрипт и имена ваших файлов).

Вы допустили аналогичную ошибку в скрипте оболочки выше: week = $1должно быть week="$1".

Кстати,всегда заключайте подстановки команд в двойные кавычки. Например, если TOKENэто *, он будет заменен списком файлов в текущем каталоге.

awk -v "group=$TOKEN"

Однако это не устанавливает groupзначение TOKEN, поскольку awk рассматривает правую часть присваивания как литерал в синтаксисе awk. Например, если значение TOKEN— это 7-символьная строка foo\bar, то переменная awk groupустанавливается в 6-символьную строку, foo␈arгде ␈— символ возврата на одну позицию (байтовое значение 8).

Самый простой способ передать переменную в скрипт awk — экспортировать ее в среду и использовать через массив ENVIRON.

Кроме того, вы не используете переменную groupнигде в скрипте awk. Регулярное выражение /group/соответствует любой строке, содержащей 5-символьную строку group. Если вы хотите проверить, является ли поле точным значением group(например, если значение TOKENравно GROUP2, то поле, содержащее , GROUP24не будет соответствовать), используйте оператор равенства ==.

  export TOKEN
  awk -F "," '{ if (FNR > 2 && $2 == ENVIRON["TOKEN"]){print $0} }' infile >> outfile_$week

Вот весь скрипт, немного упрощенный для использования синтаксиса условия-действия awk (где действие здесь опущено, поскольку оно используется print $0по умолчанию) и для того, чтобы не открывать выходной файл каждый раз:

#!/bin/sh
week="$1"
shift
for TOKEN in "$@"
do
  echo "adding records for" $TOKEN
  awk -F "," 'FNR > 2 && $2 == ENVIRON["TOKEN"]' infile 
done >"outfile_$week"

ВидетьОтвет Стефана Шазеласадля более продвинутого способа использования awk, не требующего многократной обработки входного файла.

Answer

Ваша непосредственная проблема — пробелы вокруг знака равенства. Аргументом опции -vдолжно быть присваивание. Awk видит аргумент -v, за которым следует скрипт ( =), за которым следуют имена файлов (значение TOKEN, ваш скрипт и имена ваших файлов).

Вы допустили аналогичную ошибку в скрипте оболочки выше: week = $1должно быть week="$1".

Кстати,всегда заключайте подстановки команд в двойные кавычки. Например, если TOKENэто *, он будет заменен списком файлов в текущем каталоге.

awk -v "group=$TOKEN"

Однако это не устанавливает groupзначение TOKEN, поскольку awk рассматривает правую часть присваивания как литерал в синтаксисе awk. Например, если значение TOKEN— это 7-символьная строка foo\bar, то переменная awk groupустанавливается в 6-символьную строку, foo␈arгде ␈— символ возврата на одну позицию (байтовое значение 8).

Самый простой способ передать переменную в скрипт awk — экспортировать ее в среду и использовать через массив ENVIRON.

Кроме того, вы не используете переменную groupнигде в скрипте awk. Регулярное выражение /group/соответствует любой строке, содержащей 5-символьную строку group. Если вы хотите проверить, является ли поле точным значением group(например, если значение TOKENравно GROUP2, то поле, содержащее , GROUP24не будет соответствовать), используйте оператор равенства ==.

  export TOKEN
  awk -F "," '{ if (FNR > 2 && $2 == ENVIRON["TOKEN"]){print $0} }' infile >> outfile_$week

Вот весь скрипт, немного упрощенный для использования синтаксиса условия-действия awk (где действие здесь опущено, поскольку оно используется print $0по умолчанию) и для того, чтобы не открывать выходной файл каждый раз:

#!/bin/sh
week="$1"
shift
for TOKEN in "$@"
do
  echo "adding records for" $TOKEN
  awk -F "," 'FNR > 2 && $2 == ENVIRON["TOKEN"]' infile 
done >"outfile_$week"

ВидетьОтвет Стефана Шазеласадля более продвинутого способа использования awk, не требующего многократной обработки входного файла.

AWK: Передача переменных оболочки в awk

решение1

решение2

решение3

Связанный контент