remova o número de linhas duplicadas com base na correspondência antes da primeira vírgula

Question 1

Aqui estão algumas awksoluções de duas passagens. A primeira passagem armazena a frequência do campo 1 em um array x. A segunda passagem imprime uma linha se xrelatar a frequência do campo 1 como 1

awk -F, 'first_pass{x[$1]++; next}; x[$1] == 1' first_pass=1 file first_pass=0 file

awk -F, 'BEGIN{while ((getline<ARGV[1]) > 0)x[$1]++}; x[$1] == 1' file

Answer

Aqui estão algumas awksoluções de duas passagens. A primeira passagem armazena a frequência do campo 1 em um array x. A segunda passagem imprime uma linha se xrelatar a frequência do campo 1 como 1

awk -F, 'first_pass{x[$1]++; next}; x[$1] == 1' first_pass=1 file first_pass=0 file

awk -F, 'BEGIN{while ((getline<ARGV[1]) > 0)x[$1]++}; x[$1] == 1' file

Question 2

GNU curtodatamash+sedcombinação:

datamash -sft',' -g1 count 1 <file | sed -n 's/,1$//p'

O primeiro processo do pipeline acima contará o número de itens em cada grupo dos valores do primeiro campo (agrupados por -g1), adicionando as contagens resultantes como o último campo

Answer

GNU curtodatamash+sedcombinação:

datamash -sft',' -g1 count 1 <file | sed -n 's/,1$//p'

O primeiro processo do pipeline acima contará o número de itens em cada grupo dos valores do primeiro campo (agrupados por -g1), adicionando as contagens resultantes como o último campo

remova o número de linhas duplicadas com base na correspondência antes da primeira vírgula

Responder1

Responder2

informação relacionada