Sortieren innerhalb von awk mit Tab als Feldtrennzeichen

Question 1

Wählen Sie eine dieser Optionen:

... | "sort -k2 -t \\\t "

... | "sort -k2 -t \"\t\" "

... | "sort -k2 -t'\''\t'\'' "

... | "sort -k2 -t \047\011\047" ## preferred

\011ist der Octet ASCII-Code fürTabZeichen/ \047für einfaches Anführungszeichen '

awk -v q="'" ... { print | "sort -k2 -t " q "\t" q }'

awk -v tb="'\t'" ... { print | "sort -k2 -t " tb }'

awk -v tb=$'\t' ... { print | "sort -k2 -t \"" tb "\"" }'

awk -v tb=$'\t' -v q="'" ... { print | "sort -k2 -t " q tb q }'

und viele mehr …; lesenShell-Zitatprobleme in awk; siehe auchEscape-Sequenzen in awk

Answer

Wählen Sie eine dieser Optionen:

... | "sort -k2 -t \\\t "

... | "sort -k2 -t \"\t\" "

... | "sort -k2 -t'\''\t'\'' "

... | "sort -k2 -t \047\011\047" ## preferred

\011ist der Octet ASCII-Code fürTabZeichen/ \047für einfaches Anführungszeichen '

awk -v q="'" ... { print | "sort -k2 -t " q "\t" q }'

awk -v tb="'\t'" ... { print | "sort -k2 -t " tb }'

awk -v tb=$'\t' ... { print | "sort -k2 -t \"" tb "\"" }'

awk -v tb=$'\t' -v q="'" ... { print | "sort -k2 -t " q tb q }'

und viele mehr …; lesenShell-Zitatprobleme in awk; siehe auchEscape-Sequenzen in awk

Question 2

Dies ist vielleicht keine richtige Einzeiler-Methode, aber es ist einfach und man muss nicht mit der Tabulatortaste herumspielen … :D

var=$(head -1 file.tsv);perl -ne '{ print $_ if $. > 1; }'  file.csv| sort -k2 | sed "1 i $var" | column -ts "\t"

Answer

Dies ist vielleicht keine richtige Einzeiler-Methode, aber es ist einfach und man muss nicht mit der Tabulatortaste herumspielen … :D

var=$(head -1 file.tsv);perl -ne '{ print $_ if $. > 1; }'  file.csv| sort -k2 | sed "1 i $var" | column -ts "\t"

Question 3

So würde ich Ihr eigentliches Problem, die Daten zu sortieren und dabei die Kopfzeile oben beizubehalten, lösen:

awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-

Das Obige funktioniert, indem den Eingabedaten eine 0 oder 1 vorangestellt wird (0 für die erste Zeile, 1 für alle anderen Zeilen), sodass Sie zuerst nach diesem Indikator und dann nach dem für Sie wichtigen Schlüssel sortieren und das hinzugefügte Feld anschließend einfach wieder entfernen können.

So funktioniert es schrittweise:

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv
0   head_1  head_2  head_3
1   aaa zzz c   300
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3
0   head_1  head_2  head_3
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200
1   aaa zzz c   300

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-
head_1  head_2  head_3
bbb yyy ooo a   100
ccc xxx nnn b   200
aaa zzz c   300

Answer

So würde ich Ihr eigentliches Problem, die Daten zu sortieren und dabei die Kopfzeile oben beizubehalten, lösen:

awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-

Das Obige funktioniert, indem den Eingabedaten eine 0 oder 1 vorangestellt wird (0 für die erste Zeile, 1 für alle anderen Zeilen), sodass Sie zuerst nach diesem Indikator und dann nach dem für Sie wichtigen Schlüssel sortieren und das hinzugefügte Feld anschließend einfach wieder entfernen können.

So funktioniert es schrittweise:

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv
0   head_1  head_2  head_3
1   aaa zzz c   300
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3
0   head_1  head_2  head_3
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200
1   aaa zzz c   300

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-
head_1  head_2  head_3
bbb yyy ooo a   100
ccc xxx nnn b   200
aaa zzz c   300

Sortieren innerhalb von awk mit Tab als Feldtrennzeichen

Antwort1

Antwort2

Antwort3

verwandte Informationen