awk 배열을 이전 줄의 배열과 비교

Question

댓글에 URL로 제공되는 입력 데이터는 탭으로 구분됩니다. 이는 탭으로 구분된 첫 번째 필드를 일종의 "키"로 구문 분석하여 다른 줄과 비교할 수 있음을 의미합니다. 우리는하다~ 아니다첫 번째 필드 내에서 공백으로 구분된 단어에 주의해야 하지만 첫 번째 필드 전체를 단일 엔터티로 처리할 수 있습니다.

BEGIN { OFS = FS = "\t" }

{
    count = $(NF - 1)
    key = $1
}

key != previous {
    if (previous != "")
        print previous, sum

    sum = 0
}

{
    sum += count
    previous = key
}

END {
    if (previous != "")
        print previous, sum
}

이 awk프로그램은 "count" 필드(마지막 필드에서 두 번째)를 구문 분석한 count다음 첫 번째 필드를 "키"로 사용하여 나중에 이전 줄의 키와 비교합니다. 이는 BEGIN블록(입력 및 출력 구분 기호만 설정) 다음의 첫 번째 블록입니다 .

키가 이전 줄의 키와 다르다면 이는 이제 다른 단어 집합을 보고 있다는 의미입니다. 이전 라인의 키와 합을 출력하고 합을 재설정합니다.

모든 줄에 대해 이 줄의 개수만큼 합계를 늘리고 업데이트합니다 previous(이제 이 줄은 끝났으므로 이 줄은 key다음 줄이 됩니다 previous).

마지막에는 데이터의 마지막 줄에 대한 정보를 출력합니다.

를 사용하여 이를 실행합니다 awk -f script.awk inputfile.

"한 줄짜리"로:

awk -F '\t' 'BEGIN{OFS=FS} {c=$(NF-1);k=$1} k!=p {if(p!="")print p,s;s=0} {s+=c;p=k} END {if(p!="") print p,s}' file

Answer 1