
Мне нужно вывести количество совпадающих строк в конце каждой строки.
Пример сопоставления foo
:
foo,bar,foo,foo
bar,foo,bar,bar
foo,foo,bar,bar
Результат :
foo,bar,foo,foo,3
bar,foo,bar,bar,1
foo,foo,bar,bar,2
Я проверил эту ссылку(Как подсчитать количество определенных символов в каждой строке?) но безуспешно.
решение1
Мы можем использовать awk с gsub, чтобы получить количество вхождений.
awk '{print $0","gsub(/foo/,"")}' file
Выход:
foo,bar,foo,foo,3
bar,foo,bar,bar,1
foo,foo,bar,bar,2
решение2
Возможно, со смесью bash
иgrep
$ while read -r line; do
echo -n "$line -> "
grep -o foo <<<"$line" | wc -l
done < /path/to/my-input-file
foo,bar,foo,foo -> 3
bar,foo,bar,bar -> 1
foo,foo,bar,bar -> 2
решение3
Если кто-то тоже хотел что-то на Python. Укажите имя файла и волшебное слово для подсчета.
#!/usr/bin/python3
# magic_word_count.py
# Takes a filename and magic word and prints the number of times the word
# appears on each line of the file.
#
# ./magic_word_count.py myfile.txt foo
#
import sys
filename = sys.argv[1]
magic_word = sys.argv[2]
with open(filename, 'r') as f:
for line in f.readlines():
words = line.strip().split(',')
print(len([word for word in words if word == magic_word]))
Использование:
$ cat myfile.txt
foo,bar,foo,foo
bar,foo,bar,bar
foo,foo,bar,bar
$ ./magic_word_count.py myfile.txt foo
3
1
2
решение4
Используя awk
и предполагая, что входные данные представляют собой «простой» CSV (без встроенных запятых или новых строк):
awk -v string="foo" -F, '
BEGIN { OFS = FS }
{
sum = 0
for (i = 1; i <= NF; ++i) sum += $i == string
$(NF+1) = sum
}; 1' file
Это берет строку, вхождения которой мы хотим подсчитать, а затем выполняет итерацию по полям каждой записи, подсчитывая точные совпадения. Накопленная сумма совпадающих полей затем добавляется как новое поле в конце записи, и запись печатается.