使用製表符作為字段分隔符號在 awk 內排序

Question 1

選擇以下選項之一：

... | "sort -k2 -t \\\t "

... | "sort -k2 -t \"\t\" "

... | "sort -k2 -t'\''\t'\'' "

... | "sort -k2 -t \047\011\047" ## preferred

\011是八位元組 ASCII 代碼標籤字元/\047用於單引號 '

awk -v q="'" ... { print | "sort -k2 -t " q "\t" q }'

awk -v tb="'\t'" ... { print | "sort -k2 -t " tb }'

awk -v tb=$'\t' ... { print | "sort -k2 -t \"" tb "\"" }'

awk -v tb=$'\t' -v q="'" ... { print | "sort -k2 -t " q tb q }'

還有很多 …;讀awk 中的 Shell 引用問題;也可以看看awk 中的轉義序列

Answer

選擇以下選項之一：

... | "sort -k2 -t \\\t "

... | "sort -k2 -t \"\t\" "

... | "sort -k2 -t'\''\t'\'' "

... | "sort -k2 -t \047\011\047" ## preferred

\011是八位元組 ASCII 代碼標籤字元/\047用於單引號 '

awk -v q="'" ... { print | "sort -k2 -t " q "\t" q }'

awk -v tb="'\t'" ... { print | "sort -k2 -t " tb }'

awk -v tb=$'\t' ... { print | "sort -k2 -t \"" tb "\"" }'

awk -v tb=$'\t' -v q="'" ... { print | "sort -k2 -t " q tb q }'

還有很多 …;讀awk 中的 Shell 引用問題;也可以看看awk 中的轉義序列

Question 2

這可能不是一種正確的單行方式，但很簡單，不需要使用製表符......：D

var=$(head -1 file.tsv);perl -ne '{ print $_ if $. > 1; }'  file.csv| sort -k2 | sed "1 i $var" | column -ts "\t"

Answer

這可能不是一種正確的單行方式，但很簡單，不需要使用製表符......：D

var=$(head -1 file.tsv);perl -ne '{ print $_ if $. > 1; }'  file.csv| sort -k2 | sed "1 i $var" | column -ts "\t"

Question 3

FWIW這是我如何解決對資料進行排序但保留頂部標題的實際問題：

awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-

上面的工作原理是在輸入資料前面加上0 或1（0 表示第一行，1 表示所有其他行），這樣您就可以先對該指標進行排序，然後再對您關心的真正鍵進行排序，然後再次刪除該新增的欄位。

這是分階段工作的：

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv
0   head_1  head_2  head_3
1   aaa zzz c   300
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3
0   head_1  head_2  head_3
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200
1   aaa zzz c   300

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-
head_1  head_2  head_3
bbb yyy ooo a   100
ccc xxx nnn b   200
aaa zzz c   300

Answer

FWIW這是我如何解決對資料進行排序但保留頂部標題的實際問題：

awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-

上面的工作原理是在輸入資料前面加上0 或1（0 表示第一行，1 表示所有其他行），這樣您就可以先對該指標進行排序，然後再對您關心的真正鍵進行排序，然後再次刪除該新增的欄位。

這是分階段工作的：

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv
0   head_1  head_2  head_3
1   aaa zzz c   300
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3
0   head_1  head_2  head_3
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200
1   aaa zzz c   300

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-
head_1  head_2  head_3
bbb yyy ooo a   100
ccc xxx nnn b   200
aaa zzz c   300

使用製表符作為字段分隔符號在 awk 內排序

答案1

答案2

答案3

相關內容