Сортировка внутри awk с табуляцией в качестве разделителя полей

Question 1

выберите один из этих вариантов:

... | "sort -k2 -t \\\t "

... | "sort -k2 -t \"\t\" "

... | "sort -k2 -t'\''\t'\'' "

... | "sort -k2 -t \047\011\047" ## preferred

\011это октетный код ASCII дляВкладкасимвол/ \047для одинарной кавычки '

awk -v q="'" ... { print | "sort -k2 -t " q "\t" q }'

awk -v tb="'\t'" ... { print | "sort -k2 -t " tb }'

awk -v tb=$'\t' ... { print | "sort -k2 -t \"" tb "\"" }'

awk -v tb=$'\t' -v q="'" ... { print | "sort -k2 -t " q tb q }'

и многое другое…; читатьПроблемы с цитированием Shell в awk; смотрите такжеEscape-последовательности в awk

Answer

выберите один из этих вариантов:

... | "sort -k2 -t \\\t "

... | "sort -k2 -t \"\t\" "

... | "sort -k2 -t'\''\t'\'' "

... | "sort -k2 -t \047\011\047" ## preferred

\011это октетный код ASCII дляВкладкасимвол/ \047для одинарной кавычки '

awk -v q="'" ... { print | "sort -k2 -t " q "\t" q }'

awk -v tb="'\t'" ... { print | "sort -k2 -t " tb }'

awk -v tb=$'\t' ... { print | "sort -k2 -t \"" tb "\"" }'

awk -v tb=$'\t' -v q="'" ... { print | "sort -k2 -t " q tb q }'

и многое другое…; читатьПроблемы с цитированием Shell в awk; смотрите такжеEscape-последовательности в awk

Question 2

Это, возможно, не совсем однострочный способ, но зато просто и не нужно играть с символами табуляции... :D

var=$(head -1 file.tsv);perl -ne '{ print $_ if $. > 1; }'  file.csv| sort -k2 | sed "1 i $var" | column -ts "\t"

Answer

Это, возможно, не совсем однострочный способ, но зато просто и не нужно играть с символами табуляции... :D

var=$(head -1 file.tsv);perl -ne '{ print $_ if $. > 1; }'  file.csv| sort -k2 | sed "1 i $var" | column -ts "\t"

Question 3

Кстати, вот как я бы решил вашу реальную проблему сортировки данных, но сохранив заголовок вверху:

awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-

Вышеуказанный пример работает путем добавления 0 или 1 к входным данным (0 для первой строки, 1 для всех остальных строк), чтобы вы могли сначала выполнить сортировку по этому индикатору, а затем по вашему реальному ключу, который вас интересует, а затем просто снова удалить это добавленное поле.

Вот как это работает поэтапно:

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv
0   head_1  head_2  head_3
1   aaa zzz c   300
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3
0   head_1  head_2  head_3
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200
1   aaa zzz c   300

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-
head_1  head_2  head_3
bbb yyy ooo a   100
ccc xxx nnn b   200
aaa zzz c   300

Answer

Кстати, вот как я бы решил вашу реальную проблему сортировки данных, но сохранив заголовок вверху:

awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-

Вышеуказанный пример работает путем добавления 0 или 1 к входным данным (0 для первой строки, 1 для всех остальных строк), чтобы вы могли сначала выполнить сортировку по этому индикатору, а затем по вашему реальному ключу, который вас интересует, а затем просто снова удалить это добавленное поле.

Вот как это работает поэтапно:

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv
0   head_1  head_2  head_3
1   aaa zzz c   300
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3
0   head_1  head_2  head_3
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200
1   aaa zzz c   300

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-
head_1  head_2  head_3
bbb yyy ooo a   100
ccc xxx nnn b   200
aaa zzz c   300

Сортировка внутри awk с табуляцией в качестве разделителя полей

решение1

решение2

решение3

Связанный контент