удалить количество дублирующихся строк на основе совпадения перед первой запятой

Question 1

Вот пара awkдвухпроходных решений. Первый проход сохраняет частоту поля 1 в массив x. Второй проход печатает строку, если xсообщает частоту поля 1 как 1

awk -F, 'first_pass{x[$1]++; next}; x[$1] == 1' first_pass=1 file first_pass=0 file

awk -F, 'BEGIN{while ((getline<ARGV[1]) > 0)x[$1]++}; x[$1] == 1' file

Answer

Вот пара awkдвухпроходных решений. Первый проход сохраняет частоту поля 1 в массив x. Второй проход печатает строку, если xсообщает частоту поля 1 как 1

awk -F, 'first_pass{x[$1]++; next}; x[$1] == 1' first_pass=1 file first_pass=0 file

awk -F, 'BEGIN{while ((getline<ARGV[1]) > 0)x[$1]++}; x[$1] == 1' file

Question 2

Короткий GNUdatamash+sedкомбинация:

datamash -sft',' -g1 count 1 <file | sed -n 's/,1$//p'

Первый процесс вышеуказанного конвейера подсчитает количество элементов в каждой группе значений первого поля (сгруппированных по -g1), добавив полученные значения в качестве последнего поля.

Answer

Короткий GNUdatamash+sedкомбинация:

datamash -sft',' -g1 count 1 <file | sed -n 's/,1$//p'

Первый процесс вышеуказанного конвейера подсчитает количество элементов в каждой группе значений первого поля (сгруппированных по -g1), добавив полученные значения в качестве последнего поля.

удалить количество дублирующихся строк на основе совпадения перед первой запятой

решение1

решение2

Связанный контент