![Nagios startete nicht und stoppt jetzt nicht mehr!](https://rvso.com/image/515021/Nagios%20startete%20nicht%20und%20stoppt%20jetzt%20nicht%20mehr!.png)
Ich habe ein Update auf einem CentOS-Server ausgeführt, auf dem Nagios lief. Nach dem Update konnte Nagios nicht mehr gestartet werden.
Der Fehler in den Protokollen war:
Sperre für Datei /var/run/nagios.pid konnte nicht erlangt werden: Berechtigung verweigert
Also habe ich nachgeschaut und festgestellt, dass in /var/run keine PID-Datei für Nagios vorhanden war. Ich habe eine erstellt und ihr die folgenden Berechtigungen erteilt:
-rwxr--r-- 1 nagios nagios 6. Mai 31 11:58 nagios.pid
Anschließend wurde Nagios gestartet und scheint normal zu laufen.
Das einzige Problem ist, dass es sich jetzt weigert anzuhalten, sodass ich es nicht neu starten kann, um neue zu überwachende Server und Dienste hinzuzufügen!
Wenn ich den Befehl „service nagios stop“ eingebe, erhalte ich [FAILED], aber es wird überhaupt nichts ins Protokoll ausgegeben und der Dienst bleibt aktiv.
Irgendwelche Ideen, wie ich den Dienst jetzt stoppen kann?
Ich verwende die RPM-Version, die über yum aus den RPMForge-Repositories installiert wurde. Der Server ist CenotOS 5.5.
Antwort1
Wenn Sie die Berechtigungen für den/var/ausführenOrdner selbst, können Sie Nagios so konfigurieren, dass die Sperrdatei überall auf dem System gespeichert wird, indem Sie die folgende Zeile zu Ihremnagios.cfgDatei. Solange Sie denSperrdateiOption für ein Verzeichnis, auf das Nagios Zugriff zum Erstellen, Ändern und Löschen von Dateien hat. Dann sollte alles gut gehen.
Sie können die Sperrdatei sogar in Ihrem Nagios-Installationsverzeichnis speichern, indem Sie ein Verzeichnis wie das folgende erstellen:/usr/lib/nagios/var
lock_file=/usr/lib/nagios/var
Antwort2
Finden Sie zunächst heraus, worum es bei dem pid
Prozess nagios
geht:
$ ps aux | grep nagios
Anschließend können Sie den Dienst mit diesem Befehl neu starten:
kill -HUP <nagios_pid>
und dies soll aufhören:
kill <nagios_pid>
Um Nagios automatisch zu stoppen, sollten Sie es pid
aktiviert haben /var/run/nagios.pid
. Überprüfen Sie es.
Antwort3
Wie Bart B oben sagte,nichtchmod 777 jedes Verzeichnis auf einem Produktionssystem, es sei denn, es gibt einen wirklich guten Grund dafür und Sie wissen, was Sie tun. Dies war eine schnelle Lösung, aber dies istnichtdie Lösung.
Die richtige Lösung für dieses Problem war, zumindest für mich, die Nagios-Konfigurationsdatei nagios.cfg zu aktualisieren (meine ist /etc/nagios/nagios.cfg) undänderndiese Linie:
lock_file=/var/run/nagios.pid
dazu:
lock_file=/var/nagios/nagios.pid
Die Sperrdatei ist in der Dienstkonfigurationsdatei /etc/init.d/nagios auf /var/nagios/nagios.pid eingestellt, wird aber anscheinend durch den obigen Wert in nagios.cfg überschrieben.
Anschließend können Sie den Nagios-Dienst/Daemon neu starten:
service nagios restart
Das sollte es tun.
Antwort4
Wenn der Nagios-Server unter CentOS 6.x ein Problem mit Start/Stopp hat, verwende ich diesen Befehl:/usr/local/nagios/bin/nagios -d /usr/local/nagios/etc/nagios.cfg
Es funktioniert auf meinem Nagios-Server.