csv의 열 조건을 기반으로 awk의 평균 계산

Question 1

이것 좀 봐:

awk -F, '{date1[$4]+=$1;++date2[$4]}END{for (key in date1) print "Average of",key,"is",date1[key]/date2[key]}' file
Average of 27:May:2017 is 2677.57
Average of 26:May:2017 is 1410.02
Average of 25:May:2017 is 2940.02

설명:

-F,: 구분 기호를 정의합니다. 대안적으로는awk 'BEGIN{FS=","}...

date1그런 다음 두 개의 배열 을 만들고 date2네 번째 필드를 배열 인덱스/키로 사용 $4하고 첫 번째 필드를 $1동일한 배열 위치의 기존 값에 추가된 값으로 사용합니다.

따라서 첫 번째 행에 대해 우리는

date1[27:May:2017]+=2415.02
++date2[27:May:2017]--> 값을 1씩 증가시킵니다. --> 첫 번째 줄의 값을 1로 늘립니다.

다음 같은 날짜(라인 2)에 대해 우리는

date1[27:May:2017]+=2415.02 + 3465.02
++date2[27:May:2017]--> 값을 1씩 증가시킵니다 --> 값 2(두 번째 줄)

동일한 논리는 동일한 날짜를 갖는 모든 라인과 모든 다른 날짜로 확장됩니다.

마지막으로 for루프를 사용하여 배열의 키를 반복하고 date1(또는 date2키가 두 배열 모두에서 동일함 => $4) 발견된 모든 항목에 대해 (=날짜 $4) key를 인쇄 하고 값 = 합계 도 인쇄합니다. 동일한 날짜에 대한 모든 값을 값 으로 나눈 값 = 동일한 날짜를 갖는 줄의 숫자 개수 = 동일 .keydate1[key]$1$4date2[key]$4

Answer