Hohe Belastung eines Nagios-Servers - Wie viele Service-Checks sind für einen Nagios-Server zu viel?

Hohe Belastung eines Nagios-Servers - Wie viele Service-Checks sind für einen Nagios-Server zu viel?

Ich habe einen Nagios-Server mit Ubuntu, einem 2,0 GHz Intel-Prozessor, einem RAID10-Array und 400 MB RAM. Er überwacht insgesamt 42 Dienste auf 8 Hosts, von denen die meisten mit dem check_http-Plugin alle 5 Minuten, manche sogar jede Minute überprüft werden. In letzter Zeit lag die Auslastung des Nagios-Servers über 4, oft sogar bei 6. Auf dem Server läuft auch Cacti, das jede Minute Statistiken für 6 Hosts sammelt.

Ich frage mich, wie viele Dienste eine solche Hardware bewältigen können sollte. Ist die Belastung so hoch, weil ich die Grenzen der Hardware ausreize, oder sollte diese Hardware 42 Dienstprüfungen plus Cacti bewältigen können? Wenn die Hardware nicht ausreicht, sollte ich dann mehr RAM, mehr Kerne oder schnellere Kerne hinzufügen? Welche Hardware-/Dienstprüfungen führen andere aus?

Antwort1

Sie müssen herausfinden, wo Ihr Engpass ist ...

Ich betreibe einen Nagios-Monitor, der über 400 Hosts mit HTTP-, Ping- und SSH-Checks überprüft. (zusammen mit vielen anderen passiven Checks und NSCD)

Dies ist ein 2xQuadCore-Server mit 4 SAS-Festplatten in RAID10.

Ich vermute, dass bei Ihnen E/A-Konflikte vorliegen, da das Schreiben in viele RRDs sehr ineffizient ist.

Sie müssen herausfinden, welcher Prozess Ihre Ressourcen beansprucht. (Cacti, Nagios oder etwas anderes)

Für die IO-Prüfung verwende ich am liebsten iotop. Installieren Sie iotop (das 9.04-Paket funktioniert unter 8.04)

Aber auch sonst sollte dir top dabei helfen deinen Lastenfresser zu finden.

Einmal pro Minute bei Kakteen ist ziemlich aggressiv. (Ich lasse meine in 5-m-Intervallen laufen.)

Ein Ansatz, von dem ich gehört habe, um Schreibkonflikte bei RRD zu vermeiden, besteht darin, Ihre RRD-Speicher auf einer RAM-Disk/einem TMPFs abzulegen. (Stellen Sie sicher, dass Sie dies ab und zu per Rsync mit dem permanenten Speicher verbinden.)

Viel Glück.

Antwort2

Sofern nicht Kakteen den Großteil der Last erzeugen, sollten Sie in der Lage sein, auf Ihrer Hardware weitaus mehr Prüfungen durchzuführen.

Ich verwende Nagios auf einer FreeBSD-Virtual-Maschine, die auf einem Microsoft Virtual Server auf einem saulangsamen alten PC (Pentium 3 1 GHz mit einer langsamen PATA-Festplatte) läuft. Die Virtual-Maschine hat nur 128 MB RAM und die Leistung ist miserabel.

Die durchschnittliche Auslastung beträgt jedoch etwa 0,2, wenn 158 Prüfungen auf 42 Hosts ausgeführt werden.

Antwort3

Auf einem alten PIII mit 256 MB RAM überwache ich aktiv etwa 230 verschiedene Dienste. Auf derselben Maschine laufen auch MRTG und HylaFAX für alle unsere eingehenden Faxe und das ganz bequem.

Antwort4

Mit dieser Hardware sollten Sie in der Lage sein, eine ganze Menge Nagios-Prüfungen durchzuführen. Wir führen ein ähnliches Setup mit etwa 70 Prüfungen und Nagiosgraph aus – der Hauptunterschied ist der zusätzliche RAM (der ist billig, also würde ich die Box auf 2 GB aufrüsten).

Versuchen Sie, top oder ps -aux auszuführen, um zu sehen, ob die CPU überlastet ist, aber ich bezweifle es. Sie können auch die Nagios überprüfenParallelisierungsdokumenteum festzustellen, ob Ihre Installation versucht, zu viele Prüfungen gleichzeitig auszuführen, anstatt sie zu serialisieren.

verwandte Informationen