ヘッダー名でawkの列を印刷する

Question 1

awk '
NR==1 {
    for (i=1; i<=NF; i++) {
        f[$i] = i
    }
}
{ print $(f["foo"]), $(f["baz"]) }
' file
foo baz
1 alpha
2 beta
3 gamma

これは非常に便利な慣用句です。私はスプレッドシートに大量のデータを持っており、異なるスプレッドシートには私が興味を持っている共通の列のサブセットがあるかもしれませんが、すべてのスプレッドシートで同じ順序である必要はなく、その前または間に同じ数の列があるわけでもありません。そのため、それらを CSV または同様の形式でエクスポートし、列番号ではなく列名を使用して awk スクリプトを実行するだけで済むことは非常に貴重です。

Answer

awk '
NR==1 {
    for (i=1; i<=NF; i++) {
        f[$i] = i
    }
}
{ print $(f["foo"]), $(f["baz"]) }
' file
foo baz
1 alpha
2 beta
3 gamma

これは非常に便利な慣用句です。私はスプレッドシートに大量のデータを持っており、異なるスプレッドシートには私が興味を持っている共通の列のサブセットがあるかもしれませんが、すべてのスプレッドシートで同じ順序である必要はなく、その前または間に同じ数の列があるわけでもありません。そのため、それらを CSV または同様の形式でエクスポートし、列番号ではなく列名を使用して awk スクリプトを実行するだけで済むことは非常に貴重です。

Question 2

を求めていますawkが、これにはより専門的なツールを使用することもできます: csvtool。

csvtool -t ' ' -u ' ' namedcol foo,baz file

または

csvtool -t ' ' -u ' ' col 1,3 file

Answer

を求めていますawkが、これにはより専門的なツールを使用することもできます: csvtool。

csvtool -t ' ' -u ' ' namedcol foo,baz file

または

csvtool -t ' ' -u ' ' col 1,3 file

Question 3

ファイルがTSV（「タブ区切り値」）ファイルであると仮定すると、csvkit:

$ csvcut -t -c foo,baz file.tsv
foo,baz
1,alpha
2,beta
3,gamma

出力は適切にフォーマットされた CSV になりますが、簡単に TSV に戻すことができます。

$ csvcut -t -c foo,baz file.tsv | csvformat -T
foo     baz
1       alpha
2       beta
3       gamma

オプション-cにはcsvcut数値や範囲も指定でき、並べ替える入力データの列（標準ユーティリティでは見逃しがちな機能cut）。

Answer

ファイルがTSV（「タブ区切り値」）ファイルであると仮定すると、csvkit:

$ csvcut -t -c foo,baz file.tsv
foo,baz
1,alpha
2,beta
3,gamma

出力は適切にフォーマットされた CSV になりますが、簡単に TSV に戻すことができます。

$ csvcut -t -c foo,baz file.tsv | csvformat -T
foo     baz
1       alpha
2       beta
3       gamma

オプション-cにはcsvcut数値や範囲も指定でき、並べ替える入力データの列（標準ユーティリティでは見逃しがちな機能cut）。

ヘッダー名でawkの列を印刷する

答え1

答え2

答え3

関連情報