Verzögern von Munin-Benachrichtigungen

Verzögern von Munin-Benachrichtigungen

Ich habe ein paar Server, die von Munin überwacht werden, und ziemlich häufig tritt bei einer der ausgewählten Einheiten ein vorübergehender Fehler beim Lesen von Daten auf. Das führt dazu, dass ich zwei E-Mails bekomme: eine, die mir mitteilt, dass alle Werte unbekannt sind, und die zweite, die mir fünf Minuten später mitteilt, dass doch alles in Ordnung ist.

Soweit ich das beurteilen kann, funktioniert Munin hier wie vorgesehen, aber ich würde gerne wissen, ob es eine Möglichkeit gibt, das Senden der ersten „Unbekannt“-Warnung um einen Aktualisierungszyklus zu verzögern, sodass vorübergehende Unbekannte nicht gemeldet werden. Mein aktuelles Setup bringt mir lediglich bei, die Warn-E-Mails zu ignorieren.

Gibt es andernfalls eine Möglichkeit, das Senden der „unbekannten“ Warnungen und der entsprechenden Wiederherstellungswarnungen vollständig zu deaktivieren?

Antwort1

Ich verwende Munin nicht wirklich, aber wie ich sehe, unknown_limitkann für Elemente/Plugins eine Einstellung vorgenommen werden, die definiert, wie viele aufeinanderfolgende erfolglose Lesungen erfolgen sollen, bevor ein Wert auf „unbekannt“ gesetzt wird.

Basierend auf dem Modul Munin::LimitsOld beträgt der Standardwert 3. Ich denke, Sie sollten versuchen, diese Zahl festzulegen oder zu erhöhen.

Ich habe dies auf Munin 1.4.5 überprüft.

Antwort2

Ich erreiche dies, indem ich Munin nicht direkt an die Endbenutzer, sondern über NSCA an NAGIOS benachrichtigen lasse und NAGIOS die Benachrichtigungen handhaben lasse. Das bedeutet, dass ich die (viel ausgefeilteren) Steuerelemente von NAGIOS für Benachrichtigungsverzögerung, -häufigkeit, -eskalation usw. verwenden kann. Ja, NAGIOS ist als reine Benachrichtigungs-Engine ziemlich schwer, aber Sie können es auch für qualitatives (und nicht quantitatives) Monitoring verwenden.

Antwort3

Denken Sie daran, dass einer der großen Vorteile der Verwendung von Open-Source-Tools darin besteht, dass Sie sich den Quellcode ansehen können, um genau zu sehen, was sie tun (und das Verhalten ändern können, wenn es Ihnen nicht gefällt). Ein kurzer Blick auf LimitsOld.pm zeigt, dass Gábors Vorschlag der richtige Ansatz ist - unknown_limit kann für einzelne Dienste oder global festgelegt werden und erschien etwa ab Munin 1.4.4 (siehehttp://munin-monitoring.org/ticket/828).

verwandte Informationen