열별 텍스트 파일 조회

Question 1

좋아요, 열의 길이를 알 수 없다면 bash보다 더 강력한 언어로 전환하겠습니다.

#!/usr/bin/perl
use warnings;
use strict;

my $string = shift;
open my $FH, '<', '1.txt' or die $!;
my $first_line = <$FH>;
my ($before, $name) = $first_line =~ /(.* )(NAME *)/;
my $column = length $before;
$string .= ' ' x (length($name) - length $string);     # adjust the length of $string
while (<$FH>) {
    if ($column == index $_, $string, $column) {
        /^\[([0-9]+)\]/ and print "$1\n";
    }
}

Answer

좋아요, 열의 길이를 알 수 없다면 bash보다 더 강력한 언어로 전환하겠습니다.

#!/usr/bin/perl
use warnings;
use strict;

my $string = shift;
open my $FH, '<', '1.txt' or die $!;
my $first_line = <$FH>;
my ($before, $name) = $first_line =~ /(.* )(NAME *)/;
my $column = length $before;
$string .= ' ' x (length($name) - length $string);     # adjust the length of $string
while (<$FH>) {
    if ($column == index $_, $string, $column) {
        /^\[([0-9]+)\]/ and print "$1\n";
    }
}

Question 2

필드 너비가 일정한 경우(예: 필드 너비로 표시된 파일 형식이 최대값인 경우) GNU awk( gawk(1))를 사용하고 FIELDWIDTHS고정 너비 구문 분석을 사용하도록 변수를 설정할 수 있습니다.

gawk -v searchstr="Ideas worth zero" -- '
    BEGIN { FIELDWIDTHS="6 15 27 5" }  # assuming the final field width is 5
    # Pre-process data
    {
        gsub(/[^[:digit:]]/, "", $1)  # strip out non-numbers
        for (i = 2; i <= NF; i++)
            gsub(/[[:space:]]*$/, "", $i)  # strip trailing whitespace
    }
    # match here
    $3 == searchstr { print $1 }
' file.txt

이를 쉘 스크립트나 함수로 래핑하고 매개변수화할 수 있습니다 searchstr( -v searchstr="$1").

그러나 필드가 가변 너비인 경우(즉, 데이터가 변경되면 필드 너비가 변경될 수 있음) 첫 번째 줄을 검사하여 필드 너비를 좀 더 영리하고 동적으로 결정해야 합니다. 하나의 필드가 밑줄을 사용하여 호출되는 경우 OWNER_NAME필드 이름에 공백이 없다고 가정하므로 공백이 필드 이름을 구분한다고 가정할 수 있습니다.

이를 정의하면 해당 BEGIN...줄을 다음 코드로 바꿀 수 있습니다.

NR == 1 {
    for (i = 2; i <= NF; i++)
        FIELDWIDTHS=FIELDWIDTHS index($0" ", " "$i" ")-index($0" ", " "$(i-1)" ") " "
    FIELDWIDTHS=FIELDWIDTHS "5"  # assuming 5 is the width of the last field
    next
}

그러면 첫 번째 줄의 필드를 보고 두 번째 필드와 마지막 필드의 후속 필드 위치 간의 차이를 계산하여 필드 너비를 계산합니다. 나는 마지막 필드의 너비가 5라고 가정했지만 거기에 큰 숫자를 입력하면 남은 내용에도 작동할 것이라고 생각합니다.

NAME내부에서 찾을 수 없도록 OWNER_NAME(또는 이라는 필드가 있는 경우 ) 이름 앞뒤에 공백을 찾아야 하며 , 대신 전체 필드와 일치해야 합니다(또한 일치할 수 있도록 OWNER공백을 추가해야 합니다). $0거기에 아무것도 없더라도 끝에 공간이 있습니다).

에서만 일치하는 대신 필드 이름으로 쿼리할 수 있도록 더 멋지게 만들 수 있지만 $3그건 여러분에게 맡기겠습니다.

Answer

필드 너비가 일정한 경우(예: 필드 너비로 표시된 파일 형식이 최대값인 경우) GNU awk( gawk(1))를 사용하고 FIELDWIDTHS고정 너비 구문 분석을 사용하도록 변수를 설정할 수 있습니다.

gawk -v searchstr="Ideas worth zero" -- '
    BEGIN { FIELDWIDTHS="6 15 27 5" }  # assuming the final field width is 5
    # Pre-process data
    {
        gsub(/[^[:digit:]]/, "", $1)  # strip out non-numbers
        for (i = 2; i <= NF; i++)
            gsub(/[[:space:]]*$/, "", $i)  # strip trailing whitespace
    }
    # match here
    $3 == searchstr { print $1 }
' file.txt

이를 쉘 스크립트나 함수로 래핑하고 매개변수화할 수 있습니다 searchstr( -v searchstr="$1").

그러나 필드가 가변 너비인 경우(즉, 데이터가 변경되면 필드 너비가 변경될 수 있음) 첫 번째 줄을 검사하여 필드 너비를 좀 더 영리하고 동적으로 결정해야 합니다. 하나의 필드가 밑줄을 사용하여 호출되는 경우 OWNER_NAME필드 이름에 공백이 없다고 가정하므로 공백이 필드 이름을 구분한다고 가정할 수 있습니다.

이를 정의하면 해당 BEGIN...줄을 다음 코드로 바꿀 수 있습니다.

NR == 1 {
    for (i = 2; i <= NF; i++)
        FIELDWIDTHS=FIELDWIDTHS index($0" ", " "$i" ")-index($0" ", " "$(i-1)" ") " "
    FIELDWIDTHS=FIELDWIDTHS "5"  # assuming 5 is the width of the last field
    next
}

그러면 첫 번째 줄의 필드를 보고 두 번째 필드와 마지막 필드의 후속 필드 위치 간의 차이를 계산하여 필드 너비를 계산합니다. 나는 마지막 필드의 너비가 5라고 가정했지만 거기에 큰 숫자를 입력하면 남은 내용에도 작동할 것이라고 생각합니다.

NAME내부에서 찾을 수 없도록 OWNER_NAME(또는 이라는 필드가 있는 경우 ) 이름 앞뒤에 공백을 찾아야 하며 , 대신 전체 필드와 일치해야 합니다(또한 일치할 수 있도록 OWNER공백을 추가해야 합니다). $0거기에 아무것도 없더라도 끝에 공간이 있습니다).

에서만 일치하는 대신 필드 이름으로 쿼리할 수 있도록 더 멋지게 만들 수 있지만 $3그건 여러분에게 맡기겠습니다.

Question 3

아마도 '0의 가치가 있는 아이디어'로 먼저 행을 필터링한 다음 '... 또는 그 이상' 행을 던지는 것이 가장 간단할 것입니다.

grep 'Ideas worth zero' | grep -v 'Ideas worth zero or more'

그리고 해당 파이프에서 숫자를 얻으려면 입력을 다음과 같이 하십시오.

cut -d' ' -f1 | tr -d ']['

공백으로 구분된 첫 번째 필드를 잘라내고 대괄호를 제거합니다.

적절한 필드 구분 기호가 제공되는 방식으로 파일 형식을 약간 변경할 수 있다면 가장 좋습니다.

Answer