encontre remetentes únicos de uma enorme lista de e-mails

encontre remetentes únicos de uma enorme lista de e-mails

Acabei de encontrar uma lista enorme de e-mails na minha conta de usuário em Centos /home/user/mail/new

Abri alguns deles e percebi que foram enviados de um cron job específico. O endereço do remetente é [email protected]. Preciso descobrir se todos esses e-mails foram enviados por [email protected]- São cerca de 30 GB de e-mail. Existe uma maneira de obter uma lista exclusiva de endereços De? O formato do e-mail é mais ou menos assim:

Caminho de retorno:

Envelope para:[e-mail protegido]

Data de entrega: Qui, 11 de agosto de 2011 04:34:02 -0400

Recebido: do usuário por hostname.com com local (Exim 4.69)

(envelope-de)

id 1QrQiI-0004qM-6V

para[e-mail protegido]; Qui, 11 de agosto de 2011 04:34:02 -0400

De:[e-mail protegido](CronDaemon)

Para:[e-mail protegido]

Assunto: Cron /opt/gsn/reports/pr.sh

Tipo de conteúdo: texto/simples; conjunto de caracteres=UTF-8

Enviado automaticamente: gerado automaticamente

ID da mensagem:

Data: Qui, 11 de agosto de 2011 04:34:02 -0400

[CONTEÚDO DA MENSAGEM]

Responder1

$ grep -E '^From:' /some/file | uniq

Responder2

Para obter o número total de e-mails, execute:

grep De: /home/usuário/mail/novo | wc-l

para obter a contagem de e-mails do root, execute isto

grep ^De /home/usuário/mail/novo | grep root\@hostname.com | wc-l

agora (total de e-mails) - (e-mails da raiz) = número real de e-mails do total de e-mails.

Responder3

Experimente isto:

awk '/^From: / { print $2 }' /home/user/mail/new | sort | uniq -c | sort -rn

Não é um arquivo, cada e-mail tem cerca de 20K e o total de e-mails chega a 30G.

awk '/^From: / { print $2 }' /home/user/mail/* | sort | uniq -c | sort -rn

informação relacionada