탭을 필드 구분자로 사용하여 awk 내부 정렬

Question 1

다음 옵션 중 하나를 선택했습니다.

... | "sort -k2 -t \\\t "

... | "sort -k2 -t \"\t\" "

... | "sort -k2 -t'\''\t'\'' "

... | "sort -k2 -t \047\011\047" ## preferred

\011에 대한 옥텟 ASCII 코드입니다.탭문자/ \047작은따옴표 '

awk -v q="'" ... { print | "sort -k2 -t " q "\t" q }'

awk -v tb="'\t'" ... { print | "sort -k2 -t " tb }'

awk -v tb=$'\t' ... { print | "sort -k2 -t \"" tb "\"" }'

awk -v tb=$'\t' -v q="'" ... { print | "sort -k2 -t " q tb q }'

그리고 더 많은 …; 읽다awk의 쉘 인용 문제; 또한보십시오awk의 이스케이프 시퀀스

Answer

다음 옵션 중 하나를 선택했습니다.

... | "sort -k2 -t \\\t "

... | "sort -k2 -t \"\t\" "

... | "sort -k2 -t'\''\t'\'' "

... | "sort -k2 -t \047\011\047" ## preferred

\011에 대한 옥텟 ASCII 코드입니다.탭문자/ \047작은따옴표 '

awk -v q="'" ... { print | "sort -k2 -t " q "\t" q }'

awk -v tb="'\t'" ... { print | "sort -k2 -t " tb }'

awk -v tb=$'\t' ... { print | "sort -k2 -t \"" tb "\"" }'

awk -v tb=$'\t' -v q="'" ... { print | "sort -k2 -t " q tb q }'

그리고 더 많은 …; 읽다awk의 쉘 인용 문제; 또한보십시오awk의 이스케이프 시퀀스

Question 2

이것은 적절한 한 줄짜리 방법이 아닐 수도 있지만 간단하고 탭 문자를 사용할 필요가 없습니다... :D

var=$(head -1 file.tsv);perl -ne '{ print $_ if $. > 1; }'  file.csv| sort -k2 | sed "1 i $var" | column -ts "\t"

Answer

이것은 적절한 한 줄짜리 방법이 아닐 수도 있지만 간단하고 탭 문자를 사용할 필요가 없습니다... :D

var=$(head -1 file.tsv);perl -ne '{ print $_ if $. > 1; }'  file.csv| sort -k2 | sed "1 i $var" | column -ts "\t"

Question 3

FWIW 다음은 데이터를 정렬하지만 헤더를 맨 위에 유지하는 실제 문제를 해결하는 방법입니다.

awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-

위의 작업은 입력 데이터 앞에 0 또는 1을 추가하여 작동합니다(첫 번째 줄은 0, 다른 모든 줄은 1). 먼저 해당 표시기를 정렬한 다음 관심 있는 실제 키를 정렬한 다음 추가된 필드를 다시 제거하면 됩니다. .

단계별로 작업하는 방법은 다음과 같습니다.

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv
0   head_1  head_2  head_3
1   aaa zzz c   300
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3
0   head_1  head_2  head_3
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200
1   aaa zzz c   300

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-
head_1  head_2  head_3
bbb yyy ooo a   100
ccc xxx nnn b   200
aaa zzz c   300

Answer

FWIW 다음은 데이터를 정렬하지만 헤더를 맨 위에 유지하는 실제 문제를 해결하는 방법입니다.

awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-

위의 작업은 입력 데이터 앞에 0 또는 1을 추가하여 작동합니다(첫 번째 줄은 0, 다른 모든 줄은 1). 먼저 해당 표시기를 정렬한 다음 관심 있는 실제 키를 정렬한 다음 추가된 필드를 다시 제거하면 됩니다. .

단계별로 작업하는 방법은 다음과 같습니다.

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv
0   head_1  head_2  head_3
1   aaa zzz c   300
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3
0   head_1  head_2  head_3
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200
1   aaa zzz c   300

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-
head_1  head_2  head_3
bbb yyy ooo a   100
ccc xxx nnn b   200
aaa zzz c   300

탭을 필드 구분자로 사용하여 awk 내부 정렬

답변1

답변2

답변3

관련 정보