Perl を使用してファイル内の科学的な数値を数える

Question 1

コアモジュールを使用するとScalar::Util、次のことが可能になります。

$ perl -MScalar::Util=looks_like_number -anle '
    $count += grep { looks_like_number($_) } @F;
    END { print $count }
' file
33

詳細についてはlooks_like_numberをご覧くださいperldoc perlapi。

Answer

コアモジュールを使用するとScalar::Util、次のことが可能になります。

$ perl -MScalar::Util=looks_like_number -anle '
    $count += grep { looks_like_number($_) } @F;
    END { print $count }
' file
33

詳細についてはlooks_like_numberをご覧くださいperldoc perlapi。

Question 2

PCRE 機能を使用してこれを行うことができますgrep。ちなみに、同じパターンは Perl でも使用できます。

$ grep -oP '\d+E[-+]?\d+' file.txt  | wc -l
33

単語を数えるためにもを使用できますwc -w。上記では行を数えていますが、grepは行に 1 つの一致を返すため、このシナリオではそれほど重要ではありません。

Perl の場合は、次のワンライナーを使用できます。

$ perl -lane '$c += grep /\d+E[-+]?\d+/, @F; END { print $c; }' file.txt 
33

Answer

PCRE 機能を使用してこれを行うことができますgrep。ちなみに、同じパターンは Perl でも使用できます。

$ grep -oP '\d+E[-+]?\d+' file.txt  | wc -l
33

単語を数えるためにもを使用できますwc -w。上記では行を数えていますが、grepは行に 1 つの一致を返すため、このシナリオではそれほど重要ではありません。

Perl の場合は、次のワンライナーを使用できます。

$ perl -lane '$c += grep /\d+E[-+]?\d+/, @F; END { print $c; }' file.txt 
33

Question 3

egrep働くでしょう：

egrep "[0-9].[0-9]E-[0-9]" YourFile | wc -w

アップデート：

行に数字と他の文字列の両方が含まれている場合は、次のようにしてawk問題を解決できます。

awk -F' ' '{for(i=1;i<=NF;i++)if(!(i%1))$i=$i "\n"}1' YourFile | egrep "[0-9].[0-9]E-[0-9]" | wc -w ( or wc -l )

Answer

egrep働くでしょう：

egrep "[0-9].[0-9]E-[0-9]" YourFile | wc -w

アップデート：

行に数字と他の文字列の両方が含まれている場合は、次のようにしてawk問題を解決できます。

awk -F' ' '{for(i=1;i<=NF;i++)if(!(i%1))$i=$i "\n"}1' YourFile | egrep "[0-9].[0-9]E-[0-9]" | wc -w ( or wc -l )

Question 4

単に数を数える必要がある場合は、空白で区切られたフィールドPerlのヘッダー行に続いて、次のようにすればよいと思います。

perl -lane '$sum += $#F+1 if $. > 4; END{print $sum}' file

本当に科学的にフォーマットされた数字だけを数える必要がある場合は、次のように数字を検索して置換するという方法があります。適切な正規表現そして、置換の数を数えます（Perlの置換式は、変数にバインドすると置換の数を返します）。

perl -lane '$sum += s/[-+]?[0-9]*\.?[0-9]+([eE][-+]?[0-9]+)?//g if $. > 4; END{print $sum}' file

Answer

単に数を数える必要がある場合は、空白で区切られたフィールドPerlのヘッダー行に続いて、次のようにすればよいと思います。

perl -lane '$sum += $#F+1 if $. > 4; END{print $sum}' file

本当に科学的にフォーマットされた数字だけを数える必要がある場合は、次のように数字を検索して置換するという方法があります。適切な正規表現そして、置換の数を数えます（Perlの置換式は、変数にバインドすると置換の数を返します）。

perl -lane '$sum += s/[-+]?[0-9]*\.?[0-9]+([eE][-+]?[0-9]+)?//g if $. > 4; END{print $sum}' file

関連情報