Как расширить этот селектор столбца 2 awk с помощью параметра Bash $1?

Question 1

В вашем примере входные данные имеют одинаковые значения в первом и втором поле для всех файлов (и одинаковые значения для всех файлов), что не помогает понять точный вариант использования. В конце концов, если вам действительно нужно одно и то же значение три раза и вы можете получить его из любого поля любого входного файла, вам даже не нужно проверять два других файла. Вы можете просто использовать:

cut -d, -f2 input.csv | paste -d, - - -

Конечно, это не работает для реальных входных данных, только для ваших примерных входных данных. (Поработайте над улучшением ваших примерных входных/выходных данных для этого типа вопросов, это помогаетмного.)

Если мы сделаем предположения, что:

У вас всегда есть ровно три входных файла
Называется input1.csv, input2.csv,input3.csv
С ровно двумя столбцами каждый
И вам нужен второй столбец из каждого файла

Проще всего это сделать с помощью комбинации Awk и paste(и подстановки файлов оболочки):

paste -d, input[123].csv | awk -F, -v OFS=, '{print $2, $4, $6}'

Если эти предположения неверны, вините в этом плохие примеры ввода/вывода. ;)

Answer

В вашем примере входные данные имеют одинаковые значения в первом и втором поле для всех файлов (и одинаковые значения для всех файлов), что не помогает понять точный вариант использования. В конце концов, если вам действительно нужно одно и то же значение три раза и вы можете получить его из любого поля любого входного файла, вам даже не нужно проверять два других файла. Вы можете просто использовать:

cut -d, -f2 input.csv | paste -d, - - -

Конечно, это не работает для реальных входных данных, только для ваших примерных входных данных. (Поработайте над улучшением ваших примерных входных/выходных данных для этого типа вопросов, это помогаетмного.)

Если мы сделаем предположения, что:

У вас всегда есть ровно три входных файла
Называется input1.csv, input2.csv,input3.csv
С ровно двумя столбцами каждый
И вам нужен второй столбец из каждого файла

Проще всего это сделать с помощью комбинации Awk и paste(и подстановки файлов оболочки):

paste -d, input[123].csv | awk -F, -v OFS=, '{print $2, $4, $6}'

Если эти предположения неверны, вините в этом плохие примеры ввода/вывода. ;)

Question 2

Чтобы ответить на ваш вопрос, как указано, учитывая

$ cat file
a,b,c
d,e,f
g,h,i
j,k,l

и простой тестовый сценарий

$ cat col.bash
#!/bin/bash

awk -F, -vcol="$1" '{print $col}' file

вы можете проверить, что $colдействительно ссылается на нужный столбец, т.е.

$ ./col.bash 2
b
e
h
k

Если это не работает в вашем случае, то есть другие факторы. Независимо от этого, есть гораздо более простые способы извлечения столбцов из нескольких файлов.

Answer

Чтобы ответить на ваш вопрос, как указано, учитывая

$ cat file
a,b,c
d,e,f
g,h,i
j,k,l

и простой тестовый сценарий

$ cat col.bash
#!/bin/bash

awk -F, -vcol="$1" '{print $col}' file

вы можете проверить, что $colдействительно ссылается на нужный столбец, т.е.

$ ./col.bash 2
b
e
h
k

Если это не работает в вашем случае, то есть другие факторы. Независимо от этого, есть гораздо более простые способы извлечения столбцов из нескольких файлов.

Question 3

Использование Bash и AWK в этом случае будет очень сложным. Я не смог решить проблему предложенными здесь решениями. У вас будет много проблем с "/ '/... поэтому здесь необходим один инструмент.

Используйте так же gawk, как обсуждалось в теме.Инструмент выбора ECG Bash.

# https://codereview.stackexchange.com/a/146370/122105
#!/usr/bin/gawk -f

# https://www.gnu.org/software/gawk/manual/html_node/Join-Function.html
@include "join.awk"

BEGIN {
    FS = "\"*,\"*";
    last_row = 0;
}

BEGINFILE {
    rows[0][ARGIND] = gensub(".*P([0-9]*)C.*", "\\1", "g", FILENAME);
}

{
    rows[FNR][ARGIND] = $col;
    if (FNR > last_row) { last_row = FNR; }
}

END {
    for (r = 0; r <= last_row; r++) {
        print join(rows[r], 1, ARGC - 1, ",");
    }
}

Пожалуйста, прочитайте полный ответ200_success здесьс прекрасными объяснениями.

Answer

Использование Bash и AWK в этом случае будет очень сложным. Я не смог решить проблему предложенными здесь решениями. У вас будет много проблем с "/ '/... поэтому здесь необходим один инструмент.

Используйте так же gawk, как обсуждалось в теме.Инструмент выбора ECG Bash.

# https://codereview.stackexchange.com/a/146370/122105
#!/usr/bin/gawk -f

# https://www.gnu.org/software/gawk/manual/html_node/Join-Function.html
@include "join.awk"

BEGIN {
    FS = "\"*,\"*";
    last_row = 0;
}

BEGINFILE {
    rows[0][ARGIND] = gensub(".*P([0-9]*)C.*", "\\1", "g", FILENAME);
}

{
    rows[FNR][ARGIND] = $col;
    if (FNR > last_row) { last_row = FNR; }
}

END {
    for (r = 0; r <= last_row; r++) {
        print join(rows[r], 1, ARGC - 1, ",");
    }
}

Пожалуйста, прочитайте полный ответ200_success здесьс прекрасными объяснениями.

Как расширить этот селектор столбца 2 awk с помощью параметра Bash $1?

решение1

решение2

решение3

Связанный контент