Encontre o processo que está desligando ou encerrando um programa ou serviço no Linux

Encontre o processo que está desligando ou encerrando um programa ou serviço no Linux

Na minha situação, o Postfix desliga-se misteriosamente: postfix/postfix-script parando o sistema de correio Postfix

Em um novo Ubuntu 18.04, quando executo

service postfix start

Ele inicia, mas alguns minutos depois desliga.

May 22 09:10:15 coenraad-Latitude-E5550 postfix/postfix-script[12849]: starting the Postfix mail system
May 22 09:10:15 coenraad-Latitude-E5550 postfix/master[12851]: daemon started -- version 3.3.0, configuration /etc/postfix
May 22 09:11:41 coenraad-Latitude-E5550 postfix/postfix-script[12960]: stopping the Postfix mail system
May 22 09:11:41 coenraad-Latitude-E5550 postfix/master[12851]: terminating on signal 15
May 22 09:11:53 coenraad-Latitude-E5550 postfix/postfix-script[13167]: starting the Postfix mail system
May 22 09:11:53 coenraad-Latitude-E5550 postfix/master[13169]: daemon started -- version 3.3.0, configuration /etc/postfix
May 22 09:14:12 coenraad-Latitude-E5550 postfix/postfix-script[14044]: stopping the Postfix mail system
May 22 09:14:12 coenraad-Latitude-E5550 postfix/master[13169]: terminating on signal 15

Habilitei o serviço com:

sudo update-rc.d postfix enable

Há bastante memória livre e nada mais que pareça relacionado em qualquer log.

Responder1

A princípio pensei que de alguma forma consegui instalar o postfix sem configurá-lo. O problema parecia ser resolvido por:

dpkg-reconfigure postfix

Eu descobri isso com o comando:

lastcomm --debug

após cada desligamento, e descobri:

CURRENT REC: systemd.postins |v3|     0.00|     0.00|    21.00|     0|     0|  4628.00|     0.00|   13513|   13305|     |       0|pts/11  |Wed May 22 09:13:02 2019
systemd.postins        root     pts/11     0.00 secs Wed May 22 09:13
---------------------------------------------------------------------------
CURRENT REC: systemctl       |v3|     1.00|     0.00|    21.00|     0|     0| 73472.00|     0.00|   13514|   13513|S    |       0|pts/11  |Wed May 22 09:13:02 2019
systemctl        S     root     pts/11     0.01 secs Wed May 22 09:13
---------------------------------------------------------------------------
CURRENT REC: (sd-executor)   |v3|     0.00|     0.00|     1.00|     0|     0|226496.00|     0.00|   13516|       1|SF   |       0|__      |Wed May 22 09:13:02 2019
(sd-executor)    SF    root     __         0.00 secs Wed May 22 09:13
---------------------------------------------------------------------------
CURRENT REC: systemd-sysv-ge |v3|     0.00|     0.00|     1.00|     0|     0| 61832.00|     0.00|   13532|   13516|S    |       0|__      |Wed May 22 09:13:02 2019
systemd-sysv-ge  S     root     __         0.00 secs Wed May 22 09:13
---------------------------------------------------------------------------
CURRENT REC: postfix-instanc |v3|     0.00|     0.00|     1.00|     0|     0|  4628.00|     0.00|   13519|   13516|S    |       0|__      |Wed May 22 09:13:02 2019
postfix-instanc  S     root     __         0.00 secs Wed May 22 09:13
---------------------------------------------------------------------------
CURRENT REC: postconf        |v3|     0.00|     0.00|     0.00|     0|     0| 76928.00|     0.00|   13535|   13519|     |       0|__      |Wed May 22 09:13:02 2019
postconf               root     __         0.00 secs Wed May 22 09:13
---------------------------------------------------------------------------
CURRENT REC: systemd-rc-loca |v3|     0.00|     0.00|     1.00|     0|     0| 61816.00|     0.00|   13529|   13516|S    |       0|__      |Wed May 22 09:13:02 2019
systemd-rc-loca  S     root     __         0.00 secs Wed May 22 09:13

O que fez parecer que ele estava tentando fazer alguma configuração interativa em segundo plano - que provavelmente foi programado para abortar se não estiver em uma sessão interativa. A configuração manual parecia ativar os interruptores necessários.

A saga continuou... Verifiquei cron de diferentes usuários, log de auditoria, logs de sistema para OOM killer, mas não consegui encontrar o culpado.

O que acabou me salvando da insanidade foi a resposta de Ciro Santilli aqui:https://superuser.com/questions/222912/how-can-i-log-all-process-launches-in-linux- que monitorei até parar, onde registrou isso:

20119   2102 /etc/init.d/postfix stop

E então

$ ps auxf|grep 2102
root      2102  0.0  0.0  40820  3940 ?        S    May28   2:58 /usr/bin/monit -c /etc/monit/monitrc

Aí está. O culpado é Monit.

informação relacionada