Wie diagnostizieren Sie RabbitMQ-Absturzprobleme unter Ubuntu 16?
Wenn ich sudo service rabbitmq-server status
es ausführe, meldet es:
● rabbitmq-server.service - RabbitMQ Messaging Server
Loaded: loaded (/lib/systemd/system/rabbitmq-server.service; enabled; vendor preset: enabled)
Active: failed (Result: timeout) since Wed 2018-03-21 19:44:18 UTC; 19min ago
Process: 1100 ExecStartPost=/usr/lib/rabbitmq/bin/rabbitmq-server-wait (code=killed, signal=TERM)
Process: 1099 ExecStart=/usr/sbin/rabbitmq-server (code=killed, signal=TERM)
Main PID: 1099 (code=killed, signal=TERM)
was bedeutet, dass es abgestürzt ist oder nicht gestartet werden konnte. Wenn ich jedoch htop ausführe, sehe ich Dutzende von Erlang und beam.smp
Prozessen, die von Rabbit gestartet werden.
Wenn ich Rabbit neu starte, sudo service rabbitmq-server restart
bleibt es außerdem etwa fünf Minuten lang hängen und kehrt dann schließlich mit folgender Meldung zurück:
Job for rabbitmq-server.service failed because a timeout was exceeded. See "systemctl status rabbitmq-server.service" and "journalctl -xe" for details.
Beim Laufen journalctl -xe
werden mir jede Menge Meldungen angezeigt wie:
Mar 21 20:07:48 server1 postfix/error[3719]: 280524B3A: to=<[email protected]>, orig_to=<root>, relay=none, delay=101268, delays=101268/0/0/0, dsn=4.4.1, status=deferred (delivery temporarily suspende
Mar 21 20:07:48 server1 postfix/qmgr[1784]: 2D046FAC: from=<>, size=3126, nrcpt=1 (queue active)
Mar 21 20:07:48 server1 postfix/qmgr[1784]: 2D8AD474F: from=<[email protected]>, size=751, nrcpt=1 (queue active)
Mar 21 20:07:48 server1 postfix/error[3712]: 2ED9D499A: to=<[email protected]>, orig_to=<root>, relay=none, delay=155868, delays=155868/0/0/0, dsn=4.4.1, status=deferred (delivery temporarily suspende
Mar 21 20:07:48 server1 postfix/qmgr[1784]: 2EBCF3D40: from=<>, size=3128, nrcpt=1 (queue active)
Mar 21 20:07:48 server1 postfix/error[3706]: 2D8AD474F: to=<[email protected]>, orig_to=<root>, relay=none, delay=38268, delays=38268/0/0/0, dsn=4.4.1, status=deferred (delivery temporarily suspended:
Mar 21 20:07:48 server1 postfix/error[3716]: 2D046FAC: to=<[email protected]>, relay=none, delay=76240, delays=76240/0/0/0, dsn=4.4.1, status=deferred (delivery temporarily suspended: connect to porta
Mar 21 20:07:48 server1 postfix/qmgr[1784]: 2C9DE3945: from=<>, size=3134, nrcpt=1 (queue active)
Mar 21 20:07:48 server1 postfix/qmgr[1784]: 2AA2A48B3: from=<[email protected]>, size=751, nrcpt=1 (queue active)
Mar 21 20:07:48 server1 postfix/error[3717]: 2C9DE3945: to=<[email protected]>, relay=none, delay=399644, delays=399644/0/0/0, dsn=4.4.1, status=deferred (delivery temporarily suspended: connect to po
Mar 21 20:07:48 server1 postfix/error[3701]: 2EBCF3D40: to=<[email protected]>, relay=none, delay=181242, delays=181242/0/0/0, dsn=4.4.1, status=deferred (delivery temporarily suspended: connect to po
Mar 21 20:07:48 server1 postfix/error[3712]: 2AA2A48B3: to=<[email protected]>, orig_to=<root>, relay=none, delay=59268, delays=59268/0/0/0, dsn=4.4.1, status=deferred (delivery temporarily suspended:
Gehe ich recht in der Annahme, dass Rabbit versucht, eine Menge E-Mails zu versenden, blockiert wird und anschließend abstürzt? Warum ist das so?
Antwort1
Ich habe es wie folgt behoben:
sudo killall rabbitmq-server
sudo killall beam.smp
sudo rm -Rf /var/lib/rabbitmq/mnesia/*
sudo service rabbitmq-server start
Ich musste auch meine Benutzerkonfigurationen erneut hinzufügen, aber ansonsten wurde es dadurch wieder angezeigt.
Antwort2
Das scheint kein „Absturz“ zu sein, sondern eher ein ordnungsgemäßes Herunterfahren aufgrund eines Problems. Offenbar ist der Dienst abgelaufen. Ich gehe davon aus, dass dies daran liegt, dass keine Verbindung zum Remote-Messaging-Server hergestellt werden konnte. Die „E-Mails“, die Sie gepostet haben, zeigen, dass versucht wurde, eine E-Mail-Benachrichtigung über den Fehler zu senden … was wahrscheinlich auch bedeutet, dass der Postfix-Mailserver nicht so konfiguriert ist, dass Nachrichten außerhalb der Box weitergeleitet werden.