유닉스의 파일을 열 단위로 비교

Question 1

이것이다. 각 줄 끝에 추가 쉼표가 있는 스타일 문제입니다.

awk '
     BEGIN{ FS=","; ORS="" }

     { 
       # read line from secondary file
       getline aux < "file2"
       split(aux,f2,",")

       # print current line number
       print NR" "

       # process each field in current line
       for(i=1; i<=NF; i++) {
         if ($i!=f2[i]) {
           print i","
         }
       }
       print "\n"
     }
' file1

출력:

1 3,
2 2,4,
3 3,4,

Answer

이것이다. 각 줄 끝에 추가 쉼표가 있는 스타일 문제입니다.

awk '
     BEGIN{ FS=","; ORS="" }

     { 
       # read line from secondary file
       getline aux < "file2"
       split(aux,f2,",")

       # print current line number
       print NR" "

       # process each field in current line
       for(i=1; i<=NF; i++) {
         if ($i!=f2[i]) {
           print i","
         }
       }
       print "\n"
     }
' file1

출력:

1 3,
2 2,4,
3 3,4,

Question 2

다음을 사용하면 더 쉽게 할 수 있습니다 perl.

$ perl -F',' -anle '
    BEGIN{
        print "record_number,  columns_with_diff";
        $" = ",";
    }
    if (!defined($h{$.})) {
        @{$h{$.}}{0..$#F} = @F[0..$#F];
    } else {
        @diff =  grep { $h{$.}{$_} ne $F[$_] } 0..$#F;
        print "$.\t\t@{[map {$_+1} @diff]}";
    } 
    close ARGV if eof;
' file1 file2
record_number,  columns_with_diff
1       3
2       2,4
3       3,4

이 작업을 수행하려면 입력에서 빈 줄을 제거해야 합니다.

설명

블록 에서는 BEGIN출력 헤더를 인쇄한 다음 목록 구분 기호를 다음과 같이 설정합니다.,
@{$h{$.}}{0..$#F} = @F[0..$#F]: 첫 번째 해시의 키가 줄 번호인 해시 해시를 생성하고, 각 하위 해시의 키는 필드 인덱스에서 1을 뺀 값이며, 값은 해당 필드와 일치하는 값입니다.

여기서는 해시 슬라이스를 사용하여 해시의 해시에 값을 빠르게 할당합니다.

Data::Dumper해시의 해시를 인쇄하는 데 사용하는 경우 %h다음과 같은 내용을 볼 수 있습니다.

VAR1 = {
          '2' => {
                   '2' => '89',
                   '0' => '2',
                   '1' => 'delhi',
                   '3' => 'cd'
                 },
          '3' => {
                   '1' => 'bangalore',
                   '3' => 'ef',
                   '0' => '3',
                   '2' => '56'
                 },
          '1' => {
                   '3' => 'ab',
                   '1' => 'kolkata',
                   '0' => '1',
                   '2' => '19'
                 }
        };

%h( )를 생성했다면 if (!defined($h{$.}))(처리가 완료되었음을 의미함 file1) 현재 행의 각 필드를 의 해당 값과 비교하여 %h다른 모든 인덱스를 배열에 저장합니다 @diff. map {$_+1} @diff배열의 인덱스는 0부터 시작하고 열 번호는 1부터 시작하므로 열 번호를 복원합니다.
close ARGV if eof카운터를 복원합니다 $..

Answer

다음을 사용하면 더 쉽게 할 수 있습니다 perl.

$ perl -F',' -anle '
    BEGIN{
        print "record_number,  columns_with_diff";
        $" = ",";
    }
    if (!defined($h{$.})) {
        @{$h{$.}}{0..$#F} = @F[0..$#F];
    } else {
        @diff =  grep { $h{$.}{$_} ne $F[$_] } 0..$#F;
        print "$.\t\t@{[map {$_+1} @diff]}";
    } 
    close ARGV if eof;
' file1 file2
record_number,  columns_with_diff
1       3
2       2,4
3       3,4

이 작업을 수행하려면 입력에서 빈 줄을 제거해야 합니다.

설명

블록 에서는 BEGIN출력 헤더를 인쇄한 다음 목록 구분 기호를 다음과 같이 설정합니다.,
@{$h{$.}}{0..$#F} = @F[0..$#F]: 첫 번째 해시의 키가 줄 번호인 해시 해시를 생성하고, 각 하위 해시의 키는 필드 인덱스에서 1을 뺀 값이며, 값은 해당 필드와 일치하는 값입니다.

여기서는 해시 슬라이스를 사용하여 해시의 해시에 값을 빠르게 할당합니다.

Data::Dumper해시의 해시를 인쇄하는 데 사용하는 경우 %h다음과 같은 내용을 볼 수 있습니다.

VAR1 = {
          '2' => {
                   '2' => '89',
                   '0' => '2',
                   '1' => 'delhi',
                   '3' => 'cd'
                 },
          '3' => {
                   '1' => 'bangalore',
                   '3' => 'ef',
                   '0' => '3',
                   '2' => '56'
                 },
          '1' => {
                   '3' => 'ab',
                   '1' => 'kolkata',
                   '0' => '1',
                   '2' => '19'
                 }
        };

%h( )를 생성했다면 if (!defined($h{$.}))(처리가 완료되었음을 의미함 file1) 현재 행의 각 필드를 의 해당 값과 비교하여 %h다른 모든 인덱스를 배열에 저장합니다 @diff. map {$_+1} @diff배열의 인덱스는 0부터 시작하고 열 번호는 1부터 시작하므로 열 번호를 복원합니다.
close ARGV if eof카운터를 복원합니다 $..

유닉스의 파일을 열 단위로 비교

답변1

답변2

관련 정보