Como você diagnostica problemas de travamento do RabbitMQ no Ubuntu 16?
Quando executo sudo service rabbitmq-server status
ele informa:
● rabbitmq-server.service - RabbitMQ Messaging Server
Loaded: loaded (/lib/systemd/system/rabbitmq-server.service; enabled; vendor preset: enabled)
Active: failed (Result: timeout) since Wed 2018-03-21 19:44:18 UTC; 19min ago
Process: 1100 ExecStartPost=/usr/lib/rabbitmq/bin/rabbitmq-server-wait (code=killed, signal=TERM)
Process: 1099 ExecStart=/usr/sbin/rabbitmq-server (code=killed, signal=TERM)
Main PID: 1099 (code=killed, signal=TERM)
implicando que ele travou ou falhou ao iniciar. No entanto, quando executo o htop, vejo dezenas de erlangs e beam.smp
processos iniciados pelo Rabbit.
Além disso, quando vou reiniciar o Rabbit, sudo service rabbitmq-server restart
ele trava por cerca de cinco minutos e finalmente retorna com:
Job for rabbitmq-server.service failed because a timeout was exceeded. See "systemctl status rabbitmq-server.service" and "journalctl -xe" for details.
Quando corro, journalctl -xe
vejo muitas mensagens como:
Mar 21 20:07:48 server1 postfix/error[3719]: 280524B3A: to=<[email protected]>, orig_to=<root>, relay=none, delay=101268, delays=101268/0/0/0, dsn=4.4.1, status=deferred (delivery temporarily suspende
Mar 21 20:07:48 server1 postfix/qmgr[1784]: 2D046FAC: from=<>, size=3126, nrcpt=1 (queue active)
Mar 21 20:07:48 server1 postfix/qmgr[1784]: 2D8AD474F: from=<[email protected]>, size=751, nrcpt=1 (queue active)
Mar 21 20:07:48 server1 postfix/error[3712]: 2ED9D499A: to=<[email protected]>, orig_to=<root>, relay=none, delay=155868, delays=155868/0/0/0, dsn=4.4.1, status=deferred (delivery temporarily suspende
Mar 21 20:07:48 server1 postfix/qmgr[1784]: 2EBCF3D40: from=<>, size=3128, nrcpt=1 (queue active)
Mar 21 20:07:48 server1 postfix/error[3706]: 2D8AD474F: to=<[email protected]>, orig_to=<root>, relay=none, delay=38268, delays=38268/0/0/0, dsn=4.4.1, status=deferred (delivery temporarily suspended:
Mar 21 20:07:48 server1 postfix/error[3716]: 2D046FAC: to=<[email protected]>, relay=none, delay=76240, delays=76240/0/0/0, dsn=4.4.1, status=deferred (delivery temporarily suspended: connect to porta
Mar 21 20:07:48 server1 postfix/qmgr[1784]: 2C9DE3945: from=<>, size=3134, nrcpt=1 (queue active)
Mar 21 20:07:48 server1 postfix/qmgr[1784]: 2AA2A48B3: from=<[email protected]>, size=751, nrcpt=1 (queue active)
Mar 21 20:07:48 server1 postfix/error[3717]: 2C9DE3945: to=<[email protected]>, relay=none, delay=399644, delays=399644/0/0/0, dsn=4.4.1, status=deferred (delivery temporarily suspended: connect to po
Mar 21 20:07:48 server1 postfix/error[3701]: 2EBCF3D40: to=<[email protected]>, relay=none, delay=181242, delays=181242/0/0/0, dsn=4.4.1, status=deferred (delivery temporarily suspended: connect to po
Mar 21 20:07:48 server1 postfix/error[3712]: 2AA2A48B3: to=<[email protected]>, orig_to=<root>, relay=none, delay=59268, delays=59268/0/0/0, dsn=4.4.1, status=deferred (delivery temporarily suspended:
Estou correto ao concluir que o Rabbit está tentando enviar uma tonelada de e-mails, está sendo bloqueado e, posteriormente, está travando? Por que é isso?
Responder1
Eu consertei com:
sudo killall rabbitmq-server
sudo killall beam.smp
sudo rm -Rf /var/lib/rabbitmq/mnesia/*
sudo service rabbitmq-server start
Também tive que adicionar novamente minhas configurações de usuário, mas, caso contrário, isso as trouxe de volta.
Responder2
Isso não parece ser um "travamento"... mas sim um desligamento normal devido a um problema. Aparentemente, o serviço expirou. Presumo que isso ocorra porque ele não conseguiu se conectar ao servidor de mensagens remoto. Os "e-mails" que você postou indicam que ele tentou enviar uma notificação por e-mail sobre a falha ... o que provavelmente também significa que o servidor de e-mail postfix não está configurado para retransmitir mensagens fora da caixa.