Eu tenho um texto grande no servidor Linux Centos 7 e gostaria de remover as linhas que correspondem antes da primeira vírgula
Entrada:
112112112,00,00,00
110110,01,01,02
112112112,11,11,888
110110,99,88,8
410410,22,22,22
Saída:
410410,22,22,22
Responder1
Aqui estão algumas awk
soluções de duas passagens. A primeira passagem armazena a frequência do campo 1 em um array x
. A segunda passagem imprime uma linha se x
relatar a frequência do campo 1 como 1
awk -F, 'first_pass{x[$1]++; next}; x[$1] == 1' first_pass=1 file first_pass=0 file
awk -F, 'BEGIN{while ((getline<ARGV[1]) > 0)x[$1]++}; x[$1] == 1' file
Responder2
GNU curtodatamash
+sed
combinação:
datamash -sft',' -g1 count 1 <file | sed -n 's/,1$//p'
O primeiro processo do pipeline acima contará o número de itens em cada grupo dos valores do primeiro campo (agrupados por -g1
), adicionando as contagens resultantes como o último campo