列によるテキストファイルの検索

Question 1

列の長さがわからない場合は、bash よりも強力な言語に切り替えます。

#!/usr/bin/perl
use warnings;
use strict;

my $string = shift;
open my $FH, '<', '1.txt' or die $!;
my $first_line = <$FH>;
my ($before, $name) = $first_line =~ /(.* )(NAME *)/;
my $column = length $before;
$string .= ' ' x (length($name) - length $string);     # adjust the length of $string
while (<$FH>) {
    if ($column == index $_, $string, $column) {
        /^\[([0-9]+)\]/ and print "$1\n";
    }
}

Answer

列の長さがわからない場合は、bash よりも強力な言語に切り替えます。

#!/usr/bin/perl
use warnings;
use strict;

my $string = shift;
open my $FH, '<', '1.txt' or die $!;
my $first_line = <$FH>;
my ($before, $name) = $first_line =~ /(.* )(NAME *)/;
my $column = length $before;
$string .= ' ' x (length($name) - length $string);     # adjust the length of $string
while (<$FH>) {
    if ($column == index $_, $string, $column) {
        /^\[([0-9]+)\]/ and print "$1\n";
    }
}

Question 2

フィールド幅が一定である場合、つまり、フィールド幅が最大であるファイル形式の場合は、GNU awk ( gawk(1)) を使用して、FIELDWIDTHS固定幅解析を使用するように変数を設定できます。

gawk -v searchstr="Ideas worth zero" -- '
    BEGIN { FIELDWIDTHS="6 15 27 5" }  # assuming the final field width is 5
    # Pre-process data
    {
        gsub(/[^[:digit:]]/, "", $1)  # strip out non-numbers
        for (i = 2; i <= NF; i++)
            gsub(/[[:space:]]*$/, "", $i)  # strip trailing whitespace
    }
    # match here
    $3 == searchstr { print $1 }
' file.txt

これをシェルスクリプトまたは関数でラップし、パラメーター化することができますsearchstr( -v searchstr="$1")。

ただし、フィールドの幅が可変である場合、つまり、データが変更されるとフィールドの幅が変わる可能性がある場合は、もう少し工夫して、最初の行を調べてフィールドの幅を動的に決定する必要があります。 1 つのフィールドがOWNER_NAMEアンダースコアを使用してと呼ばれていることを考えると、フィールド名にはスペースが存在しないと想定しています。そのため、空白文字でフィールド名が区切られていると想定できます。

これを定義したら、BEGIN...次のコードで行を置き換えることができます。

NR == 1 {
    for (i = 2; i <= NF; i++)
        FIELDWIDTHS=FIELDWIDTHS index($0" ", " "$i" ")-index($0" ", " "$(i-1)" ") " "
    FIELDWIDTHS=FIELDWIDTHS "5"  # assuming 5 is the width of the last field
    next
}

これは、最初の行のフィールドを調べ、最後から 2 番目のフィールドの後続のフィールドの位置の差を計算することによってフィールド幅を計算します。最後のフィールドの幅は 5 であると想定していますが、そこに大きな数字を入れれば、残りの部分で機能すると思います。

名前の前後のスペースを探して、NAME内部でスペースが見つからないかOWNER_NAME(またはというフィールドがあった場合OWNER)、代わりにフィールド全体に一致するようにする必要があります ( にスペースを追加して、$0末尾にスペースがなくても一致できるようにする必要があります)。

のみに一致させるのではなく、フィールド名でクエリを実行できるように、より高度な方法を使用することもできます$3が、それはあなたにお任せします。

Answer

フィールド幅が一定である場合、つまり、フィールド幅が最大であるファイル形式の場合は、GNU awk ( gawk(1)) を使用して、FIELDWIDTHS固定幅解析を使用するように変数を設定できます。

gawk -v searchstr="Ideas worth zero" -- '
    BEGIN { FIELDWIDTHS="6 15 27 5" }  # assuming the final field width is 5
    # Pre-process data
    {
        gsub(/[^[:digit:]]/, "", $1)  # strip out non-numbers
        for (i = 2; i <= NF; i++)
            gsub(/[[:space:]]*$/, "", $i)  # strip trailing whitespace
    }
    # match here
    $3 == searchstr { print $1 }
' file.txt

これをシェルスクリプトまたは関数でラップし、パラメーター化することができますsearchstr( -v searchstr="$1")。

ただし、フィールドの幅が可変である場合、つまり、データが変更されるとフィールドの幅が変わる可能性がある場合は、もう少し工夫して、最初の行を調べてフィールドの幅を動的に決定する必要があります。 1 つのフィールドがOWNER_NAMEアンダースコアを使用してと呼ばれていることを考えると、フィールド名にはスペースが存在しないと想定しています。そのため、空白文字でフィールド名が区切られていると想定できます。

これを定義したら、BEGIN...次のコードで行を置き換えることができます。

NR == 1 {
    for (i = 2; i <= NF; i++)
        FIELDWIDTHS=FIELDWIDTHS index($0" ", " "$i" ")-index($0" ", " "$(i-1)" ") " "
    FIELDWIDTHS=FIELDWIDTHS "5"  # assuming 5 is the width of the last field
    next
}

これは、最初の行のフィールドを調べ、最後から 2 番目のフィールドの後続のフィールドの位置の差を計算することによってフィールド幅を計算します。最後のフィールドの幅は 5 であると想定していますが、そこに大きな数字を入れれば、残りの部分で機能すると思います。

名前の前後のスペースを探して、NAME内部でスペースが見つからないかOWNER_NAME(またはというフィールドがあった場合OWNER)、代わりにフィールド全体に一致するようにする必要があります ( にスペースを追加して、$0末尾にスペースがなくても一致できるようにする必要があります)。

のみに一致させるのではなく、フィールド名でクエリを実行できるように、より高度な方法を使用することもできます$3が、それはあなたにお任せします。

Question 3

おそらく最も単純なのは、最初に「価値ゼロのアイデア」で行をフィルタリングし、次に「...以上」の行を捨てることです。

grep 'Ideas worth zero' | grep -v 'Ideas worth zero or more'

そして、そのパイプから数値を取得するには、次のように入力します。

cut -d' ' -f1 | tr -d ']['

これは、最初のフィールド (スペースで区切られる) を切り取り、角括弧を削除します。

適切なフィールド区切り文字が付くようにファイル形式を少し変更することができれば最適です。

Answer