各行にパターンの数を印刷するにはどうすればいいですか?

各行にパターンの数を印刷するにはどうすればいいですか?

各行の末尾に一致する文字列の数を出力しなければなりません。

マッチングの例foo:

foo,bar,foo,foo
bar,foo,bar,bar
foo,foo,bar,bar

結果 :

foo,bar,foo,foo,3
bar,foo,bar,bar,1
foo,foo,bar,bar,2

私はこのリンクをチェックしました(各行の特定の文字の数を数えるにはどうすればよいでしょうか?) しかし運がなかった。

答え1

awk と gsub を組み合わせて使用​​すれば、出現回数を取得できます。

 awk '{print $0","gsub(/foo/,"")}' file

出力:

foo,bar,foo,foo,3
bar,foo,bar,bar,1
foo,foo,bar,bar,2

答え2

bashおそらく、とを混ぜてgrep

$ while read -r line; do 
    echo -n "$line -> " 
    grep -o foo <<<"$line" | wc -l 
  done < /path/to/my-input-file

foo,bar,foo,foo -> 3
bar,foo,bar,bar -> 1
foo,foo,bar,bar -> 2

答え3

Python で何か必要な人もいるかもしれません。ファイル名とカウントするマジックワードを指定します。

#!/usr/bin/python3
# magic_word_count.py
# Takes a filename and magic word and prints the number of times the word
# appears on each line of the file.
#
# ./magic_word_count.py myfile.txt foo
#
import sys 
filename = sys.argv[1]
magic_word = sys.argv[2]

with open(filename, 'r') as f:
    for line in f.readlines():
        words = line.strip().split(',')
        print(len([word for word in words if word == magic_word]))

使用法:

$ cat myfile.txt 
foo,bar,foo,foo
bar,foo,bar,bar
foo,foo,bar,bar

$ ./magic_word_count.py myfile.txt foo
3
1
2

答え4

awk入力が「単純な」CSV(埋め込まれたコンマや改行なし)であると仮定して使用します。

awk -v string="foo" -F, '
    BEGIN { OFS = FS }
    {
        sum = 0
        for (i = 1; i <= NF; ++i) sum += $i == string
        $(NF+1) = sum
    }; 1' file

これは、出現回数をカウントする文字列を取得し、各レコードのフィールドを反復処理して、完全一致をカウントします。一致するフィールドの累積合計が、レコードの末尾に新しいフィールドとして追加され、レコードが印刷されます。

関連情報